我们抓取了上千条招聘信息,发现字节要重启手机研发了
        文 | Sleepy、思维怪怪2025 年 12 月,传了很久的「豆包手机」终于横空出世。

        它把豆包手机助手技术预览版装进了努比亚 M153 工程样机里,发售价 3499 元,首批大约 3 万台在发售当天就售罄了。

        记得刚发售不久的那几天它在海鲜市场的价格一度溢价好几倍。

        动察 Beating 编辑部还买了两台。倒不是因为它是一台多好用的手机,恰恰相反,第一代豆包手机作为「技术预览版」,体验不算好。

        但让我们特别兴奋的地方在于,它第一次把 AI 从聊天框里拽了出来,从一个 Chat bot 变成了一个 AI Agent,并且能够控制一台手机。

        在豆包手机上,AI 可以看见屏幕,可以理解你正在浏览的内容,可以听见你说话,可以在不同的 App 之间跳转,可以直接帮你做很多事,比如查车票、购物比价、领券下单、修图。

        虽然像支付这种比较敏感的环节还需要用户自己做确认,但它确实已经能独立完成很多在过去必须由我们自己一下一下点击完成的操作了。

        虽然它还是有点笨,有时候反应很慢,有时候会卡住,像刚学会用智能手机那样不利索,但它确实让我们第一次直观地感受到 AI 进入日常能有多便利。

        后来龙虾才诞生并且火爆全球,AI Agent 成为了继 ChatGPT 问世之后 AI 领域的又一个 iPhone 时刻,一堆厂商、创业者开始兜售预装好 OpenClaw 的电脑、手机。

        豆包手机领先了他们至少一个版本,甚至可以说豆包手机是在这轮 Agent 热潮的先驱。

        但很可惜的是豆包手机很快就撞上了大厂们的围剿。微信、淘宝、支付宝、银行 App 等场景陆续出现访问或操作受阻。

        有人说这是「封杀」,也有人说只是触发了风控,但对用户来说没什么区别,就是用不了了。

        我们非常遗憾。豆包手机当然不是一台成熟的消费电子产品,但它让整个行业看见了下一代入口的雏形。

        所以即便豆包手机的那波热度已经过去了,但我们还是没有把这件事完全放下。

        直到最近,我们的日常信息抓取捕捉到了上千条招聘信息,分析下来发现,字节似乎要重启手机研发了。

        三个口径,一条线索我们从字节跳动官方的社招页面抓取了三个口径,分别是 AI 创新业务、移动 OS 和豆包手机助手。

        在按照职位 ID 进行去重后,我们进一步抓取了详情页信息,按照岗位名称、岗位描述、任职要求里面的关键词进行了交叉整理。

        和普通 AI App 团队招聘不同的是,字节的这批社招岗位里,还出现了手机系统、相机、触控、联网、续航、发热、芯片适配、结构设计、整机工艺、产线测试等岗位。

        这些词在互联网公司里不常见,它们是手机厂商、供应链公司、工程团队才会天天处理的东西。

        字节要招人下工厂了。不过这并不能肯定字节会做自己的手机品牌,但至少可以确定的是,他们正在重新启动手机级终端的研发工作。

        下面让我们看看这些岗位本身说明了什么。豆包手机助手:从回答问题到替人执行先看豆包手机助手。

        我们又做了一次更加聚焦的筛选工作,在原始数据中检索名称、描述和要求中出现了「豆包手机助手」的岗位,一共 83 个,并且这些岗位能够分成三大类,这三类又恰好能够拼出一个系统级 AI Agent 的形状。

        第一类岗位,负责让 AI 具备作为 Agent 的能力。

        比如「Agent 开发工程师-豆包手机助手」这个岗位写到,需要让 AI 做到任务拆解、上下文组织、工具调用、记忆检索、状态管理、结果校验和异常恢复。

        就是我们如今使用的所有的 AI Agent 的基础能力。

        第二类岗位,负责让 AI Agent 有个好记性。

        岗位出现了「感知和记忆」「用户记忆」「个人知识图谱」「长期偏好」这些方向。

        如果要让 AI Agent 真的融入到我们的生活中,就不能让它每天都像第一次认识我们,它需要有靠谱、稳定的长期记忆。

        当然这很容易触碰到隐私和边界的问题,但从招聘资料来看,字节至少已经开始把「记忆」当作豆包手机助手最重要的能力之一来进行研发。

        第三类岗位,负责的是让 AI Agent 在手机里能发挥出那些能力。

        豆包手机助手如果要替用户操作手机,就不能只活在云端,更不能只是一个 App。

        它需要有一整套能力,包括模型、记忆、任务执行、端侧部署、系统应用、音视频、通信、测试和质量保障,才能听懂用户说话,理解环境,跨设备协同,随时待命,并且不出乱子。

        移动 OS:手机底层才是 Agent 的难关再看移动 OS。

        移动 OS 相关岗位有 236 个,主要办公地点集中在北京、上海和深圳。

        在岗位描述中,反复出现的词是内核、芯片、驱动、相机、显示、音频、网络、功耗、热管理、量产交付。

        这几乎都是更靠近硬件和手机底层系统的词。举例来看。

        「内核 Leader-移动 OS」这个岗位的职责写到,要带领内存和存储团队做新高通平台的内核适配与开发,让系统能和主流手机芯片配合起来,并且管好手机里的内存和存储。

        这些能力是一个 AI Agent 想要做到实时响应、能在后台处理任务的关键。

        再比如,岗位里还出现了 SoC、BSP、RTOS 这些词。

        SoC 可以粗略理解成手机的核心芯片,BSP 是让系统和硬件互相认识、配合的一套底层软件,RTOS 则常用于一些对响应和功耗要求很高的场景。

        所以移动 OS 岗位所释放出的信号是,字节正在招那些懂手机级终端系统的人,他们至少要知道,AI Agent 运行在手机上之后,在哪里会被权限问题卡住,在哪里会被功耗问题卡住,在哪里会被系统稳定性卡住,哪些问题需要和芯片、厂商、测试团队一起解决。

        从正在招聘的这些岗位要求来看,字节已经进入到手机的深水区了。

        坐标深圳:硬件和量产的信号另外有必要单独拎出来看的是那些坐标在深圳的岗位。

        如果说坐标北京的岗位更偏模型、算法和平台,坐标上海的岗位更偏产品和工程,那么坐标深圳的岗位往往会和硬件、供应链、测试和量产有关。

        一个项目如果只是云端服务,深圳没那么重要;一旦要碰实体产品,深圳就会变得很重要。

        我们在深圳相关岗位里看到的,也正是这些东西。有些岗位写的是人机交互设计,覆盖硬件实体交互、软件界面交互、多端联动体验。

        这些岗位不只考虑屏幕里的那些界面怎么设计,还要考虑实体设备的手感、按键、如何唤醒、如何和其他设备联动。

        还有一些岗位更靠近工程现场,比如互连、功耗、通信短距、基带、整机工艺、结构、测试工艺。

        这些词和「智能体」「多模态」「世界模型」比起来,没那么好听。

        但消费电子最后就是这些东西决定生死。如果字节只是想把豆包做成一个更好的手机 App,它不需要干这么多苦差事。

        它一旦开始招这些岗位,就说明已经准备好上这条船了。

        字节不能只做 App在以前,手机是 App 的容器;到了 AI 时代,手机可能会变成 Agent 的身体。

        如果手机只是 App 的容器,那么字节这样的公司可以凭内容、算法和产品力,通过一个个 App 建立自己的王国。

        但如果手机变成 Agent 的身体,用户先发出任务,谁能接下任务,谁就有机会决定后面的路径。

        这个路径里,App 会被降级成可调用的工具。这会让所有超级 App 都不舒服。

        因为 Agent 天生会越过中间层。所以,真正难的地方,可能不在于豆包能不能打开一个 App,而在于别人愿不愿意让它打开。

        而一个能替用户做决定的 AI,不可能像普通 App 那样被轻松放行。

        Agent 要从聊天框走向操作层,就必须处理一大堆过去不属于 AI 团队的脏活累活。

        他们要知道系统什么时候会杀后台,操作什么时候会触发风控,手机为什么发热,工厂为什么良率上不去。

        过去这些事不归 AI 团队管,可现在都绕不开了。所以字节要招聘这些岗位。

        它可能不一定真的会推出一款手机,但字节一定不能再只做别人手机里的 App 了。

        大模型公司想成为下一代用户入口,就不能永远寄居在别人的操作系统里。-END-
🔗 原文链接:http://mp.weixin.qq.com/s?__biz=MzkyMTczNjE3Nw==&mid=2247490315&idx=1&sn=e7b2da23a28527f5eb54791baf2a9775&chksm=c0d0e92fafbf4a0c7f4f75e815e8419749015f3b8572d4a4a9af450dc211634f15f5a55c66af
← 返回列表