OpenAI 首席执行官 Sam Altman 于 3 月 31 日在 X 平台上宣布,ChatGPT 4 的图像生成功能现已"向所有免费用户开放!"
最近,由于用户们大量使用该功能生成吉卜力工作室风格的动画图像,这个图像生成器引起了广泛关注。3 月 27 日,面对用户们争相使用图像生成工具的情况,Altman 在帖子中表示其服务器"快要融化了"。
Altman 当时表示,图像生成功能将免费提供,但免费用户每天限制生成三张图片。订阅标准版 (每月 20 美元) 或专业版 (每月 200 美元) 的用户则不受此限制。
我测试了这个工具来创建本文的主图。尽管 ChatGPT 应用程序一度出现连接中断,但最终在不到五分钟内生成了一张 ChatGPT 飞越纽约的图像。
AI 竞争日趋激烈
OpenAI 通过开放图像生成器扩大 ChatGPT 用户群的举措,标志着 AI 技术公司之间竞争的最新篇章。除了美国、中国和其他国家的众多创业公司外,还有 Apple、Anthropic、Microsoft 以及刚在一周前推出最新 AI 模型 Gemini 2.5 的 Google。据估计,ChatGPT 每周活跃用户约 5 亿,但其他 AI 模型也在迅速发展。
除了提升处理任务和解决问题的能力外,AI 模型越来越多地被要求创建图像和视频等内容。ChatGPT 还有一个名为 Sora 的视频创作功能,但目前仅向付费用户开放。
AI 怀疑者转变为用户
经济学博士、AI 顾问和《包容方程式》作者 Serena Huang 表示,她最近也在社交媒体上看到大量吉卜力风格的图像,并一直在思考像 OpenAI 这样的图像生成器广泛使用所带来的影响。
她向 CNET 表示:"AI 图像生成是提高生产力和创新的强大催化剂。它可以加快内容创作过程,实现营销材料的快速开发,并可能促进更具吸引力的沟通。总的来说,AI 的趣味性也有助于其推广,能够让许多 AI 怀疑者在一夜之间转变为用户。"
不过,Huang 指出,人们应该关注 AI 生成内容的版权复杂性、执行 AI 任务所需的能源消耗,以及图像生成可能对创意产业造成的影响,包括就业岗位流失。
Huang 预计,其他提供基础图像创作功能的公司,如 Microsoft Copilot,可能会提升其服务水平。她说:"随着用户争夺战的加剧,我预计将会出现重大进展。"
好文章,需要你的鼓励
Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei(达里奥·阿莫代)进行了一次对话。
哈工大和360研究团队联合开发了Light-IF框架,成功解决了大型语言模型在处理复杂指令时的"偷懒思维"问题。该框架通过教AI学会"预览和自检"的工作方式,显著提升了AI对多重约束条件任务的处理能力。Light-IF-32B模型在四个权威测试平台上均取得最佳成绩,超越了多个知名大型模型。研究团队已开源相关模型和代码,为AI助手的发展开辟了新方向。
GPT-5是OpenAI于2025年8月发布的新一代多模式大模型,兼具高效应答与深度推理能力,并在安全性、准确性和多语言表现上取得显著提升,尤其在医疗、内容安全与防越狱方面展现突破性进步。
T-Tech实验室开发出革命性的VL-DAC训练方法,让AI机器人能够通过观看简单模拟环境学会复杂的现实世界技能。该方法将AI的"观察思考"与"实际行动"分开训练,避免了传统方法需要复杂参数调整的问题。实验证明,AI在导航、卡牌游戏等简化环境中训练后,在真实世界的游戏控制、空间规划和网页操作任务中性能分别提升50%、5%和2%,为降低AI开发成本开辟了新路径。