V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wzwmeme
V2EX  ›  程序员

大佬们,一人来一道大数据面试题,准备年后跳槽(我这是真求助)

  •  
  •   wzwmeme · 15 小时 46 分钟前 · 437 次点击
    6 条回复    2025-01-25 03:44:01 +08:00
    2Nfree
        1
    2Nfree  
       15 小时 33 分钟前
    什么是 RDD ? RDD 的特性是什么?
    Spark 的执行流程是怎样的?从提交作业到执行完成经历了哪些步骤?
    如何优化 Spark 作业性能?(结合内存管理、分区数量、数据倾斜处理等)
    Flink 和 Spark Streaming 的异同?
    dylanqqt
        2
    dylanqqt  
       15 小时 31 分钟前
    你觉得你能给公司带来多大价值?
    Geekgogo
        3
    Geekgogo  
       15 小时 30 分钟前
    你在工作中遇到最有挑战性的难题是什么?你是如何解决的
    lianhuayu420
        4
    lianhuayu420  
       15 小时 7 分钟前
    CEP 生态了解多少,简单谈谈
    huangsijun17
        5
    huangsijun17  
       13 小时 42 分钟前
    应聘程序员,好点先说一下自己的技术栈,再来问题目啊。不然提问的连问你什么语言都不知道。
    levelworm
        6
    levelworm  
       3 小时 53 分钟前 via Android
    针对偏数仓的数据工程:

    BigQuery 一张表默认能有多少分区?超过的话写入新的分区会这么样?

    请问你有没有从上游 api 获取数据、最终写入数据仓库的经验?请简单从需求分析到项目提交介绍一下每个流程。请重点介绍一下遇到的难点,以及你是如何做监控和测试的。

    请问你有没有优化 Spark 查询的经验?能否说一个例子?请对其中的技术考量多进行一点量化的讲解。

    请问你们公司的代码审核和测试是什么样的?能否简单描述一下你们的 CICD 管道?

    请问你们团队是在工程团队,还是在业务团队?请问你们团队主要的客户是哪些组?你们和业务部门有没有经常的直接对接,还是通过分析组来进行联络?粗略估计一下,你们组的临时任务多吗?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   968 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 23:37 · PVG 07:37 · LAX 15:37 · JFK 18:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.