Jason Interview Note
Created|Updated
|Post View:
Author: 李俊泽
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
Announcement
博客为本人搭建 Github托管 仅记录学习过程 不做引流 不做排名 不打广告!
Catalog
- 1.
- 2. 机器学习部分
- 2.1. 有监督学习和无监督学习
- 2.2. 什么是特征工程
- 2.3. 过拟合和欠拟合
- 2.4. KNN 算法的核心思想
- 2.5. KNN分类问题和回归问题
- 2.6. KNN算法K值的选择
- 2.7. 特征预处理(归一化,标准化区别)
- 2.8. 交叉验证和网格搜索
- 2.9. 损失函数是什么
- 2.10. 线性回归中最优参数求解
- 2.11. 梯度下降的常见类型
- 2.12. L1, L2 正则化的区别
- 2.13. 逻辑回归流程及解决了什么
- 2.14. 混淆矩阵四象限
- 2.15. 精确率,召回率反映什么
- 2.16. ROC曲线横纵轴,每个点
- 2.17. AUC 指标
- 2.18. 决策树?基本结构
- 2.19. 熵(Entropy)在决策树中作用
- 2.20. ID3,C4.5,CART 决策树
- 2.21. 决策树节点切分依据
- 2.22. 决策树剪枝
- 2.23. Bagging 与 Boosting区别
- 2.24. Adaboost 的完整构建流程
- 2.25. 梯度提升树与随机森林区别
- 2.26. XGBoost推导过程概述
- 3. 深度学习
- 4. NLP
- 5. 序列标注任务
- 6. 基线模型
- 7. 预训练任务
- 8. 神经机器翻译中的曝光偏差,幻觉翻译与跨域稳定性
- 9. 优化专题
- 10. 机器学习模拟面试题库
- 11. NLP面试题库
- 11.1. Transformer架构
- 11.2. 注意力机制QKV
- 11.3. 自注意力机制的计算过程
- 11.4. CBOW模式和skipgram模式(FASTTEXT)
- 11.5. NLP中词向量的表示方法
- 11.6. BERT是双向语言模型, 如何理解
- 11.7. BERT多头注意力机制代码层面
- 11.8. 为什么在Transformer用LayerNorm
- 11.9. view和transpose先后问题
- 11.10. 预训练模型序列长度为1000+
- 11.11. MacBERT在优化MLM预训练任务
- 11.12. 多分类问题数据样本不均衡
- 11.13. 对比学习最重要的两个衡量指标
- 11.14. Transformer和BERT中的位置编码
- 11.15. 模型在工业界的加速部署的问题? 一般部署中比较喜欢的模型有哪些?







