李飞飞,被称为“人工智能教母”的计算机科学家,于今年 4 月份创建了一家名为 World Labs 的初创企业。这是一家专注于开发“空间智能”技术的人工智能公司。World Labs 的目标是使 AI 能够像人类一样理解和推理三维物理世界,从而在视觉数据处理方面实现突破。
World Labs 在成立后的短短几个月内,已经完成了两轮融资,估值迅速突破 10 亿美元。主要投资者包括知名风投公司 Andreessen Horowitz(a16z)和 AI 基金 Radical Ventures。最新一轮融资筹集了约 1 亿美元,显示出投资者对李飞飞创业项目的强烈兴趣
02 空间智能,AI 发展的关键一环
李飞飞的创业方向是「空间智能(Spatial Intelligence)」。她在 4 月份的一场 TED 演讲中提出了这个说法,她认为人工智能系统不应仅限于视觉识别和语言交互,还需要具备与环境互动的能力。
例如一只猫推动玻璃瓶,生物脑可以在瞬间评估物体的几何形状、空间位置及其与周围物体的关系,并预测接下来可能发生的事情。空间智能正是试图让 AI 具备这种能力,从而在三维世界中有效行动。
(图源:Fei-Fei Li X 推文)
她正在和团队正在研发,能够合理推断图像和文本在三维环境中表现的算法。这些算法不仅可以理解和分析二维的信息,还可以想象和预测这些信息在三维空间中的表现形式。更进一步,这些算法可以基于这些预测采取行动。这种能力类似于人类在复杂环境中导航和交互的能力,是人工智能领域一个重要的发展方向。
World Labs 的主要目标是创造出具有这种'空间智慧'的 AI 模型,使其不仅能感知环境,还能在其中进行有意义的互动。这种技术进步预计将为自主机器人、沉浸式虚拟体验以及增强现实应用等领域带来前所未有的可能性。
03 应用前景和挑战同样巨大
在应用前景方面,李飞飞提出空间智能有望在多个行业中得到应用
医疗方面,可以通过提供实时的三维可视化来辅助外科手术,提高手术的精确度和结果。
制造业方面,空间智能通过理解组件之间的空间关系来优化生产线,提高效率并减少错误。
机器人方面,空间智能有望推动机器人在三维环境中更好地感知和行动
从视觉识别到复杂环境理解和交互的过程中,空间智能也面临不少挑战
真实世界的模糊性和不确定性:真实世界的环境中存在许多不确定因素,例如光线变化、物体外观的多样性以及遮挡等。这些因素会导致数据中的错误、不一致和缺失,给空间智能的实现带来困难
动态性:世界是不断变化的,要求 AI 模型能够实时适应这些变化。例如,自驾车或无人机导航等应用需要快速且准确地处理空间数据
计算复杂性:处理三维数据需要高计算能力,尤其是在实时应用中。这对硬件和算法的效率提出了更高的要求
多模态数据的复杂性:空间理解通常需要整合来自图像、深度传感器和地图等多种来源的信息。这些数据集通常非常庞大且复杂,给存储、处理和分析带来了挑战
Reference:
https://www.reuters.com/technology/stanford-ai-leader-fei-fei-li-building-spatial-intelligence-startup-2024-05-03/
https://www.theverge.com/2024/7/17/24200496/ai-fei-fei-li-world-labs-andreessen-horowitz-radical-ventures
https://www.ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world?subtitle=en&trigger=0s
https://x.com/drfeifei/status/1790811274684584257
来源 | Z Potentials
本文来自新知号自媒体,不代表商业新知观点和立场。 若有侵权嫌疑,请联系商业新知平台管理员。 联系方式:system@shangyexinzhi.com