分享好友 最新动态首页 最新动态分类 切换频道
智能周报|大模型技术浪潮里的机会和陷阱
2024-12-19 19:08

  Key Points

  大模型及应用

  李飞飞公司发布3D生成系统,直接把2D照片变3D视频;

  Google发布世界模型Genie 2,可以生成3D世界并预测角色动作;

  ChatGPT探索在回答中植入广告;

  OpenAI开启12天连续发布计划,首日发布推理模型o1正式版及o1-pro;

  苹果为使用百度大模型付了100亿美元,但模型效果不如意;

  Copilot的「Vision」功能上线;

  公司动态

  地平线副总离职创业机器人;

  小米自动驾驶负责人刘方离职,加入机器人创业;

  效仿阿里巴巴,商汤也把公司拆了;

  Google NotebookLM核心团队集体离职创业;

  有了首位CFO后,OpenAI又有了首位CMO;

  英特尔新CEO可能是个华人;

  月之暗面陷股权危机。

  大模型及应用

  李飞飞公司发布3D生成系统,直接把2D照片变3D视频

  12月2日,李飞飞创立的空间智能公司World Labs发布一个人工智能系统,它能够通过单个2D图像生成3D场景。只用上传一张图片,该系统就能将其变成一个3D场景,然后用户就能像戴上VR眼镜一样在这个场景中自由移动、从多个角度审视场景并观察某个物体的细节。此外,该功能还可被用于改变2D照片的景深,模拟推拉变焦或调整机位效果。此前,业内已有的3D生成模型多基于像素进行生成,存在分辨率低且视角不稳定的问题。相较而言,World Labs生成的3D环境稳定、可交互且可修改。在博客文章中,World Labs并未将这项成果称为模型,而是「AI系统」。官方称,这些成果是早期预览,目前已对公众开放候补试用。

  Google发布世界模型Genie 2,可以生成3D世界并预测角色动作

  12月5日,Google DeepMind发布最新版基础世界模型Genie 2。它能够将2D图片直接转换为3D视频,并且,人类或者AI智能体可以控制这个3D世界中的角色,当用户通过键盘和鼠标发出指令后,Genie 2会根据这些操作预测用户控制的角色下一步会发生什么。而且,DeepMind称,Genie 2可以从同一个起始帧生成不同的轨迹,能够记住视野外的部分,然后在它们再次可见时准确呈现它们,并可以创建不同的视角。在一致性方面,Genie 2最长可以生成一分钟,官方的大多数示例持续10至20秒。

  ChatGPT探索在回答中植入广告

  12月2日,有报道称,OpenAI考虑在人工智能产品中引入广告,以开辟新的收入来源。此前,主做AI搜索的Perplexity已经在产品中植入广告。OpenAI目前在向营利性企业转型,OpenAI首席财务官Sarah Friar表示,公司会「谨慎选择」广告投放的时间和场景,在推出广告这件事上不是很着急。但今年5月,OpenAI已聘请Google广告前负责人担任公司副总裁。目前,OpenAI的主要收入来源是ChatGPT会员费用,以及应用程序接口(API)接入费用,其中API的收入并不理想。

  OpenAI开启12天连续发布计划,首日发布推理模型o1正式版及o1-pro

  当地时间12月5日,OpenAI首席执行官Sam Altman宣布从当日开始将连续12个工作日发布新的AI功能和产品。活动首日OpenAI推出了月付费200美元的ChatGPT Pro以及正式版的推理模型o1。ChatGPT Pro将使用o1的升级版模型o1-pro。和此前发布的测试版推理模型o1-preview相比,o1和o1-pro在数学和代码领域都有明显提升,后两者在AIME数学竞赛中的得分较o1-preview提升超50%,在Codeforces代码竞赛中得分较preview版本提升超40%。在GPQA Diamond博士级别的科学问题测试中,后两者的表现也略优于preview。

  苹果为使用百度大模型付了100亿美元,但模型效果不如意

  12月4日,有报道称,苹果和百度正在合作为在中国销售的iPhone添加Apple Intelligence功能,但双方的合作目前遇到阻碍。不过目前,苹果和百度都没有对此消息做出公开回应。据报道,苹果和百度工程师们正在共同改进文心大模型,使其更适合iPhone用户,但该模型在理解提示词和常见场景的响应准确性上仍然存在困难。此外,报道称两家公司还因如何使用iPhone用户数据来训练和改进模型产生了分歧。百度希望保存并分析从iPhone用户的AI相关查询中获得的数据,但苹果的隐私政策则禁止收集此类数据。

  Copilot的「Vision」功能上线

  12月5日,微软正式开始测试全新功能Copilot Vision。这项功能于今年10月首次发布,旨在让AI助手「看见」用户在浏览器中浏览的网页,并对页面上的文字、图片和内容进行分析。「当你选择启用Copilot Vision时,它会『看到』你所在的页面,与你一起阅读,并帮助你解决问题,」微软Copilot团队在博客中表示,「浏览网页不再是孤独的体验,你不再只是面对满屏的标签页。」Copilot Vision是一项可选功能,用户需要明确授权后,AI助手才能读取网页内容。在10月的功能展示中,微软演示了AI助手如何读取OneDrive中的图片,甚至能够识别手写的菜谱并提供烹饪建议。此外,在网上购物时,用户还可以利用这一功能获得商品推荐。

  公司动态

  地平线副总离职创业机器人

  12月2日,有报道称,地平线前副总裁、软件平台产品线总裁余轶南已于近期正式离职。离开地平线之后,余轶南将从事具身智能创业,主要做消费级产品方向,包含机器人。余轶南2015年加入地平线,是地平线最早创始人团队成员之一,曾任百度深度学习研究院科学家,是百度-清华联合培养博士,其导师是地平线创始人、CEO余凯。在地平线近10年的任职期间,余轶南一直从事自动驾驶、计算机视觉等领域的研究。

  小米自动驾驶负责人刘方离职,加入机器人创业

  12月3日,有消息称,小米汽车自动驾驶产品技术负责人刘方已离职。「新皮层」了解,刘方已不在小米内部通讯录名单中。爱企查显示,刘方于今年9月注册成立了一家人形机器人公司「阿米奥机器人」。10月也曾有报道称,刘方将入职安克创新,负责刚组建的具身智能团队,直接向安克创新副总裁、智新科技总裁祝芳浩汇报。刘方是小米最早期的一批员工,离职前担任小米汽车自动驾驶产品技术负责人和量产负责人,参与了小米自动驾驶团队筹建、技术研发和量产落地的全过程。加入小米前,刘方在Google中国搜索业务部门任职。

  效仿阿里巴巴,商汤也把公司拆了

  12月3日,商汤科技董事长兼CEO徐立发布全员信,宣布组织调整结束,公司启用「1+X」的新架构。其中,「1」代表以生成式AI为核心的商汤核心业务,「X」则代表商汤集团重组拆分的生态企业,包括智能汽车「绝影」、家庭机器人「元萝卜」、智慧医疗、智慧零售等,各生态企业设立独立的CEO。后续,这些生态企业可能获得灵活的激励机制和融资通道。目前,商汤非核心业务中只单独披露了智能汽车「绝影」的发展状况。根据商汤2024年上半年财务报告,「绝影」业务收入1.68亿元,同比增长100.4%,在商汤公司营收中占比提升至9.7%。

  Google NotebookLM核心团队集体离职创业

  12月3日,Google旗下大模型应用NotebookLM团队原负责人Raiza Martin在社交媒体宣布离职创业。与她一起离职创业的,还有NotebookLM设计师Jason Spielman和核心工程师Stephen Hughes。Martin接受媒体采访时称,三人创办的新公司业务将面向消费者,用最新的人工智能模型开发一些对普通人有用的产品。该公司仍处于起步阶段,尚未宣布任何融资,其网站也显示「正在建设中」。NotebookLM是Google Labs的实验性AI应用,由Google大模型Gemini 1.5 Pro提供支持。产品上线于2023年7月,最初只是一款能够根据文件内容生成文字摘要的AI笔记应用,核心团队规模不到10人。今年9月,NotebookLM推出音频概述功能,可以生成对话式的播客,用户数量大涨。10月,该应用的访问量同比激增超过200%,达到了3150万次。有报道称,NotebookLM未来将被集成到智能手机的Gemini App中。

  有了首位CFO后,OpenAI又有了首位CMO

  12月3日,OpenAI宣布引入加密货币交易所Coinbase前高管Kate Rouch担任首任CMO,新的人事任命于12月10日生效。Kate Rouch称, 她的主要工作是面向终端消费者和企业客户推销包括ChatGPT在内的OpenAI旗下产品套件,同时负责与外界沟通OpenAI开发AGI的使命。Kate Rouch在品牌营销领域工作多年。自2010年离开贝恩公司的咨询工作后,她在社交网站Meta的营销部门工作了11年,最终成为公司品牌和产品营销的副总裁,工作范围涵盖Facebook、Instagram、WhatsApp以及Messenger等公司核心App产品。2021年8月,Kate Rouch转而加入加密货币交易所Coinbase,担任后者首任CMO,推动公司投放美国超级碗广告。

  英特尔新CEO可能是个华人

  12月4日,有报道称,在基辛格(Pat Gelsinger)于周一辞职后,英特尔正在积极考虑几位CEO候选人,其中就包括前董事会华裔成员陈立武(Lip-Bu Tan)。周一,该公司还任命首席财务官David Zinsner和高管Michelle Johnston Holthaus为临时联席首席执行官。陈立武于1959年出生于马来西亚的华人家庭,本科毕业于南洋理工大学物理学,后又分别在麻省理工学院、旧金山大学获得核工程硕士学位和工商管理硕士学位。2004年,陈立武加入Cadence,并在2009年至2021年期间担任Cadence的CEO,同时还在软银、惠普、AMCE、伟创力等公司担任过董事等职位。2022年9月,陈立武加入英特尔,主要负责与芯片制造相关的核心业务。

  月之暗面陷股权危机

最新文章
英文简历模板:打造专业求职文档
简历是求职者向潜在雇主展示自己的第一份文件。它需要清晰地传达求职者的职业背景、技能和成就,以便吸引雇主的注意并获得面试机会。一个精心编写的简历能够在众多申请者中脱颖而出,因此了解其基本构成和框架至关重要。英文简
全方位品牌曝光度提升,关键词推广优化营销策略解析
本文针对关键词推广优化策略,详细阐述了全方位提升品牌曝光度的方法。通过精准定位、内容营销、多渠道推广等手段,有效提升品牌知名度和市场份额。策略包括优化关键词、提升内容质量、利用社交媒体等,助力企业实现品牌价值最大化。随着互
GPT-4.0来袭:人工智能新纪元即将开启
1.1 计算效率 GPT-4o在计算效率上有了显著提升。这意味着它可以在同样的硬件资源下处理更多的请求,或在相同时间内完成更多的任务。这对于高并发应用场景(如大型客服系统)来说尤为重要。 1.2 响应速度 由于优化了底层
最新寄生虫站群 揭秘最新寄生虫站群:网络生态新威胁
警惕“最新寄生虫站群”:一场网络黑帽SEO的隐秘之战在当今这个数字化时代,互联网已经成为人们获取信息、交流思想、开展业务的重要平台然而,随着网络技术的飞速发展,一些不法分子也利用技术手段进行非法活动,其中,“最新寄生虫站群”
百度蜘蛛池优化:深度解析搜狗收录蜘蛛池代运营,助力网站优化,提升流量转化
深度解析搜狗收录蜘蛛池代运营,助力网站优化。通过百度蜘蛛池优化,有效提升网站流量和转化率,实现高效SEO推广。本文目录导读:什么是搜狗收录蜘蛛池代运营?搜狗收录蜘蛛池代运营的优势搜狗收录蜘蛛池代运营的操作方法如何有效提升网站
四、怎么样选择适合本身的文档智能写作软件
文档智能写作软件盘点:哪些软件更胜一筹?在数字化时代的浪潮中人工智能()技术正以前所未有的速度发展渗透到了咱们生活的各个领域。在写作领域文档智能写作软件以其高效、智能的特点成为了广大写作者和创作者的得力助手。本文将为您介绍
Android apk md5获取 安卓手机如何打开.md5文件
视频消重软件吾爱伪原创 安卓手机怎么看视频md5 或者看标题中的文章,赞美这篇文章,机器人会认为你可能会喜欢这篇文章,我们将来会推荐类似的文章。。视频消重软件吾爱伪原创 安卓手机怎么看视频md5 自媒体运营技巧:短视频优质素材选题方
SEO百度快排工具,提升排名效率的秘密武器
《SEO百度快排工具:优化你的网站排名利器》随着互联网的发展,越来越多的企业和个人开始重视网站的建设和运营,而SEO优化作为提升网站流量和排名的重要手段,更是备受关注,在众多的SEO工具中,百度快排工具因其高效、便捷的特点,成为了
17种免费网店推广方法
现在,做网店不仅仅需要货物的质量,更重要是推广。如果没有好的推广方法,那么就算你的东西再好也没有人知道。推广的好坏决定网店和网站的信誉度和知名度,有的网店前期推广不顾实际的情况,为了有吸引力而推出很多优惠,最后导致达不到实
微信公众号写作软件有哪些:免费、好用、推荐列表
在数字化时代微信公众号已经成为、个人和企业传播信息的必不可少平台。为了提升内容优劣和写作效率,多写作软件应运而生,它们不仅可以帮助客户优化文章结构,还能提供丰富的编辑功能让写作变得更加轻松。本文将为您推荐部分免费且好用的微
相关文章
推荐文章
发表评论
0评