大家好,我是对白。
今天给大家分享一篇小伙伴的算法岗秋招总结文章,作者的背景是:1个腾讯实习、4个比赛、2个项目、1篇CCF-A二作和CCF-C一作,虽然网易、快手和百度都挂了,华为还在池子里,但最终拿下腾讯和字节的offer,希望能帮助到下半年准备秋招的小伙伴们,以下为原文。
一. 字节技术中台一面(通过):
算法题:删除倒数第N个链表
面试题:
1、为什么要用尖括号标记实体,尖括号在BERT词表中么,最好用unuse1字符;
2、FastText和Word2vec的区别;
3、Xgboost和Adaboost、GBDT、随机森林,随机森林如何采样;
4、怎么解决人工漏标、错标,NER的损失函数,关系抽取为什么用这个模型,有调研其它模型么;
二面(挂):
1、手撕编辑距离;
2、Xgboost如何分裂,公式,树的生成;
3、逻辑回归推导;
4、交叉熵;
5、softmax;
二. 字节电商一面(通过):
1、逻辑回归求导、均方误差和交叉熵的区别;
2、防止欠拟合、过拟合、梯度爆炸的方式;
3、BERT结构、transformer中feed forward的作用;
4、self-attention的形式,为什么要除以根号d_k;
5、算法题:手撕kmeans,链表反转、扑克牌随机分3堆,大小王在同一堆的概率;
6、图最短路径算法;
二面(通过):
1、比赛:为什么使用注意力机制、介绍multi sample dropout;
2、注意力机制为什么不用多头;
3、矩阵相加和点乘;
4、SPU海量数据查重;
5、softmax;
6、手撕代码:前k个相似整数、最长不重复子串;
三面(通过):
1、比赛;
2、实习项目;
3、手撕代码:堆排序、组成某个值的硬币种数(回溯)、不相邻子序列最大和;
三. 华为消费者BG一面(通过):
1、算法题:LeetCode 739 每日温度;
2、决策树算法有哪些:ID3、C4.5、CART;
3、TF-IDF特征;
4、BERT mask策略,分别的作用;
5、多模态建模思路;
6、上线部署时延要求,模型剪枝、模型蒸馏;
7、Transformer与LSTM相比,优势在哪;
8、Boosting算法的优缺点;
二面(通过):
1、实习项目;
2、为什么要finetune;
3、知识图谱技术路线,信息抽取综述;
三面(通过):
问的问题跟HR差不多
四. 阿里本地生活(上海)一面(通过):
1、实习项目,fusion层,下一步如何优化,如何处理长文本;
2、语言模型,Word2vec,具体流程,损失函数,优化算法(hierarchical softmax、negative sampling);
3、逻辑回归损失函数为什么取log;
4、模型评估,F1、ROC-AUC;
5、kmeans聚类,向量距离不适合用欧氏距离衡量,如何变换;
6、CRF损失,实体识别有尝试其他算法么,关系抽取阈值有选择么;
五. 网易有道一面(通过):
1、介绍中文人机对话技术评测比赛,别的队伍的优点;
2、介绍试题生成项目;
3、介绍BERT、attention公式,为什么除以根号dk;
4、介绍AAAI的论文,负责哪部分;
5、手撕算法:最小k个数、移掉k位数字;
二面(通过):
1、正则化有哪些;
2、深度神经网络为什么不使用sigmoid或tanh激活函数,什么情况下可以使用;
4、Self-attention时间复杂度;
5、手撕:循环递增数组查找、self-attention实现;
三面(通过)
1、给你一个项目,描述下你的技术路线;
六. 百度知识图谱一面(通过):
1、Vggnet的Resnet的区别,Densenet;
2、Transformer在哪些地方体现了共享和并行;
3、is 和 ==区别;
4、re match 和 search;
5、range返回的是什么;
6、python内存管理、浅拷贝和深拷贝;
7、如何拼接字符串最高效;
8、手撕:二叉树层序遍历、连续子数组乘积最大;
二面(通过):
1、docker原理;
2、手撕:LRU;
3、场景题:给定一个文章,如何识别出所有观点(一个句子),如何识别出核心观点,如何识别出提出者
三面(通过):
1、实习项目背景、难点分析;
2、给定一个文本,如何抽取aspect、opinion、sentiment;
3、反问:部门规模、氛围、交流,管理;
**四面(通过):
**
1、比赛负责什么,每个人的分工;
2、情感识别的建模思路;
3、知识图谱:项目背景,有考虑意图识别么,实体消歧,为什么用pipeline、不用joint;
4、如果现在考虑的话该怎么提升模型性能;
5、CRF和HMM的区别,HMM解决哪三个问题;
6、CRF基于条件分布建模是什么意思,什么条件;
7、维特比思路,解决HMM的什么问题;
8、词向量发展历史:one-hot、NNLM、word2vec、glove(推导公式)、fasttext、ELMO、CoVE(不了解)、GPT、BERT、ERNIE(清华的不了解)、ERNIE 2.0、Bert-wwm、Roberta、Xlnet;
关于我我是对白,清华计算机硕士,BAT算法工程师。欢迎关注我的微信公众号: 对白的算法屋,日常分享编程经验和技术干货,帮助你少走弯路!还可以加我微信,领资源和进交流群。