「我即将离开麻省理工学院,不再继续攻读博士学位。人工智能的发展速度太快,人类已然难以跟上。
但或许还有一条出路:我发现数字人类的实现可能性,远比大多数人想象的要大。倘若能有顶尖的人工智能研究者助力,或许投入 100 亿美元、用上 5 万台 H100,在不到 10 年的时间里,就能实现这一目标。」
写下这两段话的是 Isaak Freeman,麻省理工学院的一名博士生。他认为,人工智能发展太快,人类已然难以跟上。生物大脑的进化受限于碳基组织的物理规律(如神经信号传导速度、寿命、记忆容量),如果人类保持碳基形态,注定会在智力竞争中被 AI 淘汰。将意识迁移到数字基质上,是让人类智能实现「指数级扩展」的唯一出路。
也就是说,既然我们无法阻止 AI 狂奔,那就利用 AI 创造的算力和工具,把自己也变成「数字形态」,从而加入这场竞赛。
在科学界,这个想法并不新鲜,在 2023 年《流浪地球 2》上映时还引发过热议(电影里刘德华饰演的图恒宇为了给车祸去世的女儿丫丫「完整的一生」,不惜违规将她的数字信息备份上传。)但 Isaak 表示,他不认为这事儿还停留在科幻层面,而是有了各种支撑其实现的现实可能性——我们完全可以通过高分辨率扫描,把现有的智能结构完整地复制出来。
为了证明自己不是心血来潮,他给了一个粗略的计算:
运行人类大脑所需的算力,可能远比想象中少——大约 5 万张 H100 GPU 就足够了。而 xAI 目前已拥有逾 20 万张 H100 或更高规格的芯片。在相对悲观的假设下,若采用当前高分辨率的神经元模型(如 Hodgkin-Huxley 模型)以及多状态突触,模拟人类大脑大约需要 600 exaFLOP/s 的算力、每 GPU 700 GB 的内存容量,以及 24 GB/s 的互联带宽——这些指标,今天的超算集群已经触手可及。
而若更简单的神经元模型(如 Leaky-Integrate-and-Fire 模型)就能胜任(这一点仍有待实证研究验证),那么模拟一个人类大脑所需的算力,可能低至约 2 到 3 petaFLOP/s,几乎相当于单张 H100 在 FP16 精度下的算力。当然,内存容量与互联带宽很可能才是更紧张的瓶颈所在。
但问题的核心在于:该运行哪些神经元?参数如何设定?连接方式又该如何构建?
因此,数据采集才是真正的瓶颈,而这一环节本身就面临重重难题:我们需要数百台下一代显微镜持续运行数年;需要自动化的大规模组织采集与染色流程;需要约 20 倍放大率的膨胀显微镜技术,并对 30 种以上的受体、神经递质与神经肽进行全面的分子染色;还需要 X 射线显微镜,以便在一年内完成对整个人类大脑的成像。与此同时,还需要能够跨越蠕虫、鱼类等动物完整成像脑活动的全脑功能成像设备,从而破解「结构-功能」的对应关系。
除此之外,研究人员还需要开发结构到功能的预测模型、连接组校对模型、严格的评估基准,以及以动物仿真作为概念验证的完整研究框架。
令人鼓舞的是,这一领域正在逐渐成形:从早期的线虫仿真尝试(如 BAAIWorm),到已绘制完成的 14 万神经元果蝇连接组,再到一项不完整的果蝇仿真实验意外在 X 平台上引发病毒式传播,脑机接口研究所生成的大量数据集,即将面世的斑马鱼连接组,乃至能够以吉赫兹速度成像的新一代显微镜。Isaak 认为,种种迹象表明,「数字人类」的前沿探索,已不再只是遥远的科幻构想。
正是带着让这一领域变得更加平易近人的愿望,Isaak 在离开 MIT 之前,耗费大量心血撰写了一篇深度报告,系统梳理了从线虫仿真迈向数字人类的完整路径。他坦言,这份论文仍粗糙、仍不完善,但其中倾注了他满腔的热情与心血。
报告标题:From Worm to Human: Scaling Brain Emulation
报告链接: https://pdf.isaak.net/scaling-emulations
这个论文详细规划了从线虫(302 个神经元)到人类(860 亿神经元)的全脑仿真路线图,包括连接组学成本、数据瓶颈、技术路径等。
图注:电子显微镜连接组学的现状。
论文指出,实现这一宏大愿景需要三大核心支柱的协同突破:结构测绘、功能记录与计算仿真。而摆在研究者面前的第一座高山,便是最基础的结构测绘。
想要模拟大脑,首先得知道大脑长什么样。目前主要依赖电子显微镜(EM),但它面临极大的规模化难题。人工校对成本极高,例如果蝇连接组的校对就花费了 33 个「人年」。如果要扫描人类大脑,按照目前的成本,仅单个神经元的重建就需要天文数字的资金。
为此,作者提出了结合膨胀显微镜(ExM)和蛋白质条形码等新兴技术。这些技术能在保留分子层面信息(如离子通道、神经递质受体)的同时,大幅降低追踪难度,让 AI 自动分割模型的准确率飙升。
图注:EM vs ExM 图像对比
当然,仅有静态的物理结构是不够的,大脑是会放电的,我们还需要记录神经元的动态放电过程。但哺乳动物的大脑组织会散射光线,导致目前光学成像的「玻璃天花板」卡在表面以下 1 到 2 毫米深处。
于是作者找了两个天然的「替代品」:天生透明的斑马鱼幼体,以及体型袖珍的线虫。在这些生物上,人类已经能够初步实现全脑、单神经元级别的实时功能记录,这为建立「结构-功能」的映射关系提供了至关重要的真实数据。
那如何将静态的连接图谱转化为动态的仿真?论文指出,在果蝇视觉系统和线虫的初步实验中,即使是最简单的微分方程模型,只要有准确的连接组数据,也能重现令人惊讶的真实生物行为。
正如前文所述,单纯的计算速度(FLOP/s)已经不再是最大的绊脚石。真正的挑战在于「内存墙」与「互联带宽」。模拟千亿个神经元和庞大的突触网络,需要约 70 PB 的内存容量和极高的跨节点通信速度,这是目前偏向纯算力的 AI 数据中心需要克服的架构难题。
最后,如何证明我们真的「上传」了一个人类,而不是造了一个只会查表的机器?作者提出了类似于图灵测试的「具身图灵测试」——把仿真大脑放入虚拟躯体中,看它能否像真实的线虫或老鼠一样觅食、学习和趋利避害。
作者估算,这绝非几家实验室能完成的零散工作,而是需要一场类似人类基因组计划或阿波罗计划的「大科学」工程,可能需要耗时 10 到 25 年,投资 50 亿到 500 亿美元。
本文来自微信公众号 “机器之心”(ID:almosthuman2014),编辑:张倩、+0 ,36氪经授权发布。