给大家分享几个最新的社招大厂面试题,看看大厂的大数据开发社招面试变化,整体来说还是属于AI+数据开发;大厂开始在大数据的基础上问一些AI数仓赋能的问题,整体来看还是以大数据为主,AI为辅。

围绕着还是你们公司平台AI怎么做的,如何赋能数仓的?你怎么借助这些平台赋能提效的,其次你自己有哪些AI应用探索,熟悉哪些AI应用?中大厂数仓AI应用是一个工程化的过程,需要借助公司平台建设的能力,但是公司的能力往往也是能力的体现,所以我们要熟悉大厂怎么做的;现在涤生的同学冲击中大厂的基本简历都写了AI相关职责,作为加分项;

1、字节抖音社招6年面试:字节整体还是大数据为主,AI为辅探索性问题;

  1. 自我介绍

  2. 做的最好的项目哪个,展开介绍下?

  3. 项目细节,业务架构

  4. 项目难点介绍?

  5. 数据治理怎么做的?成果如何?

  6. 数仓规范设计,如何监督规范的实施?

  7. 评价模型治理好坏的指标有哪些?

  8.  重复指标如何治理?日常开发如何避免指标重复建设?

  9. Spark任务除了长时效任务还有哪些异常治理过?怎么发现的,怎么定位的,解决的?

  10. Spark Shuffle 和MR Shuffle有什么区别

  11. 宽窄依赖?一段SQL到底启多少个job、stage?

  12. 用过Starrock数据模型有几种,每类有什么样的特性?SR和CK关于Join性能的对比?

  13. 小文件是如何产生的,并如何治理?

  14. 你们数仓AI这块哪些探索?

  15. 你日常开发如何通过AI赋能提效?

  16. Text-to-SQL主流的这种技术方向有哪几大类吗?智能问数的准确性如何提升?

  17. SQL连续登录变形题;

  18. 其他一些有的没的问题;

2、阿里云智-社招6年面试:这个部门很看重AI的赋能应用,问了比较多的AI问题;

  • 1.Text-to-SQL应用经验?

  • 2.Text-to-SQL是否做过评测级建设?

  • 3.Spark任务优化中AI应用的流程?

  • 4.大模型中是否出现幻觉,以及是否有做分类和校准的工作?

  • 5.AI在Spark任务优化中没有分析到位的部分如何解决?

  • 6.AI在Spark任务优化过程中是否是自动化的,是否考虑做成SOP?

  • 7.数据资产管理可以从哪些方面入手使用AI大模型?

  • 8.数据资产管理使用AI大模型可能出现哪些问题,哪些部分更容易做,以及如何去完善?

  • 9.团队新人如何给代码规范?

  • 10.数仓项目介绍与项目问题的问答?

  • 11.数据湖相关问题?

3、平安集团社招5年面试:整体还是大数据面试为主;

  • 1、范式建模与维度建模的区别?为什么用维度建模?

  • 2、如何设计一张事实表,列举关键字段并说明原因,(想听到 明细层的一张表,主键、外键、事实)

  • 3、数据清洗做了什么?脏数据怎么做?ODS和DWD的处理是什么?

  • 4、比较复杂的半结构化数据如何处理?例如日志,如何落到结构化的表,怎么做转化和逻辑化处理?例如有一个长的码值的地址字段,可能有缺失,例如只有省或者定位到区,文本字段如何解析?这是一个关键字段不能舍弃,如何处理?

  • 5、如何针对一段运行缓慢的SQL进行调优?

  • 6,SQL:连续三天用户登记

  • 7、HDFS\MR 的执行过程

  • 8、用户活跃度如何拆解?

  • 9、数据治理做了哪些工作?

  • 10、为什么要离职?

  • 11、未来的发展方向,自己的3-5年规划是什么?

  • 12、Ai赋能工作有没有心得体会

  • 13、介绍自己的三个优点三个缺点

  • 14、为什么上家半年就离职

  • 15、质量布控中,发现上游系统有问题,如何去推动其他项目组协调解决?如果一两个月都没推动,你又该怎么解决?

  • 反问:1、团队定位及工作职责是什么?业务是否稳定?

  • 2、个人职责会不会有分散,既要做这个又要做另外的?

  • 3、内部有活水,但前提是一年以上稳定。

其实AI时代岗位都不会原地消失,而是岗位的标准会被逐步抬高,当然行业本质其实还是不变的 ,AI+,不是AI替换所有。未来3年内,很多岗位都会被AI+,借助AI被重塑。

就像数据开发岗,未来也会被AI重塑,我们会借助AI提效,比如“智能问数”会逐步替换很多的基础的数据分析岗,SQL取数岗,BI看板搭建岗位,一个人可以借助大模型AI的工具更加多快好省的干活哈(意味着越来越卷)。当然我们也会借助AI进行任务诊断数据治理,也会借助AI做集群监控管理,所以我们需要去拥抱AI+大数据。但是岗位本质不变,还是对海量数据的存储与海量数据的计算。其他后端岗位,产品经理,数据分析,运维,安全,算法都是一样,都会被AI重塑这些岗位。

涤生的AI大模型+大厂研发提效系列打磨录制中,很快也会上线了哈;

图片

图片

图片

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐