最新字节等面经看看大数据开发面试的变化?
给大家分享几个最新的社招大厂面试题,看看大厂的大数据开发社招面试变化,整体来说还是属于AI+数据开发;大厂开始在大数据的基础上问一些AI数仓赋能的问题,整体来看还是以大数据为主,AI为辅。
围绕着还是你们公司平台AI怎么做的,如何赋能数仓的?你怎么借助这些平台赋能提效的,其次你自己有哪些AI应用探索,熟悉哪些AI应用?中大厂数仓AI应用是一个工程化的过程,需要借助公司平台建设的能力,但是公司的能力往往也是能力的体现,所以我们要熟悉大厂怎么做的;现在涤生的同学冲击中大厂的基本简历都写了AI相关职责,作为加分项;
1、字节抖音社招6年面试:字节整体还是大数据为主,AI为辅探索性问题;
-
自我介绍
-
做的最好的项目哪个,展开介绍下?
-
项目细节,业务架构
-
项目难点介绍?
-
数据治理怎么做的?成果如何?
-
数仓规范设计,如何监督规范的实施?
-
评价模型治理好坏的指标有哪些?
-
重复指标如何治理?日常开发如何避免指标重复建设?
-
Spark任务除了长时效任务还有哪些异常治理过?怎么发现的,怎么定位的,解决的?
-
Spark Shuffle 和MR Shuffle有什么区别
-
宽窄依赖?一段SQL到底启多少个job、stage?
-
用过Starrock数据模型有几种,每类有什么样的特性?SR和CK关于Join性能的对比?
-
小文件是如何产生的,并如何治理?
-
你们数仓AI这块哪些探索?
-
你日常开发如何通过AI赋能提效?
-
Text-to-SQL主流的这种技术方向有哪几大类吗?智能问数的准确性如何提升?
-
SQL连续登录变形题;
-
其他一些有的没的问题;
2、阿里云智-社招6年面试:这个部门很看重AI的赋能应用,问了比较多的AI问题;
-
1.Text-to-SQL应用经验?
-
2.Text-to-SQL是否做过评测级建设?
-
3.Spark任务优化中AI应用的流程?
-
4.大模型中是否出现幻觉,以及是否有做分类和校准的工作?
-
5.AI在Spark任务优化中没有分析到位的部分如何解决?
-
6.AI在Spark任务优化过程中是否是自动化的,是否考虑做成SOP?
-
7.数据资产管理可以从哪些方面入手使用AI大模型?
-
8.数据资产管理使用AI大模型可能出现哪些问题,哪些部分更容易做,以及如何去完善?
-
9.团队新人如何给代码规范?
-
10.数仓项目介绍与项目问题的问答?
-
11.数据湖相关问题?
3、平安集团社招5年面试:整体还是大数据面试为主;
-
1、范式建模与维度建模的区别?为什么用维度建模?
-
2、如何设计一张事实表,列举关键字段并说明原因,(想听到 明细层的一张表,主键、外键、事实)
-
3、数据清洗做了什么?脏数据怎么做?ODS和DWD的处理是什么?
-
4、比较复杂的半结构化数据如何处理?例如日志,如何落到结构化的表,怎么做转化和逻辑化处理?例如有一个长的码值的地址字段,可能有缺失,例如只有省或者定位到区,文本字段如何解析?这是一个关键字段不能舍弃,如何处理?
-
5、如何针对一段运行缓慢的SQL进行调优?
-
6,SQL:连续三天用户登记
-
7、HDFS\MR 的执行过程
-
8、用户活跃度如何拆解?
-
9、数据治理做了哪些工作?
-
10、为什么要离职?
-
11、未来的发展方向,自己的3-5年规划是什么?
-
12、Ai赋能工作有没有心得体会
-
13、介绍自己的三个优点三个缺点
-
14、为什么上家半年就离职
-
15、质量布控中,发现上游系统有问题,如何去推动其他项目组协调解决?如果一两个月都没推动,你又该怎么解决?
-
反问:1、团队定位及工作职责是什么?业务是否稳定?
-
2、个人职责会不会有分散,既要做这个又要做另外的?
-
3、内部有活水,但前提是一年以上稳定。
其实AI时代岗位都不会原地消失,而是岗位的标准会被逐步抬高,当然行业本质其实还是不变的 ,AI+,不是AI替换所有。未来3年内,很多岗位都会被AI+,借助AI被重塑。
就像数据开发岗,未来也会被AI重塑,我们会借助AI提效,比如“智能问数”会逐步替换很多的基础的数据分析岗,SQL取数岗,BI看板搭建岗位,一个人可以借助大模型AI的工具更加多快好省的干活哈(意味着越来越卷)。当然我们也会借助AI进行任务诊断数据治理,也会借助AI做集群监控管理,所以我们需要去拥抱AI+大数据。但是岗位本质不变,还是对海量数据的存储与海量数据的计算。其他后端岗位,产品经理,数据分析,运维,安全,算法都是一样,都会被AI重塑这些岗位。
涤生的AI大模型+大厂研发提效系列打磨录制中,很快也会上线了哈;



AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)