Akamai坚持“简而未减、网络先行、拥抱开源”的独特定位。凭借“鱼与熊掌兼得”的特色,过去几年,Akamai在电商、流媒体、广告科技、SaaS、金融科技等行业客户中获得了广泛认可。
复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。
谷歌宣布为Chrome iOS版推出新功能,用户可在工作和个人谷歌账户间轻松切换,无需反复登录登出。该功能支持托管账户浏览,实现严格的数据分离,工作账户的标签页、历史记录和密码等本地数据与个人浏览完全隔离。随着企业不再提供公司手机,员工常需在个人设备上访问公司资源,此更新有助企业允许员工使用自选设备。
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。
OpenAI宣布其最新实验性推理大语言模型在2025年国际数学奥林匹克竞赛中达到金牌水平。尽管机器在数学推理、代码生成等认知任务上表现卓越,但这并不意味着它们具备真正的智能。机器缺乏知识迁移能力、情感理解、自我意识、内在动机等关键特征。它们无法像人类那样灵活适应新环境,也不具备主观体验和意识。真正的智能需要多方面综合能力,而非仅仅在特定任务上的优异表现。
Amazon研究团队开发的BYOKG-RAG技术通过多策略检索和迭代优化,解决了传统知识图谱问答系统难以适应不同图谱结构的问题。该技术将大语言模型与专业检索工具结合,在五个基准测试中平均提升4.5个百分点,特别适用于企业级应用。已开源发布。
最新研究显示,通过运用心理学技巧和巧妙措辞,可以有效操控生成式AI突破其原有约束。研究发现,使用权威性、互惠性等7种心理学说服原理,能让AI违规回应的几率从33.3%提升至72%。心理学专业人士在操控AI方面可能具有天然优势。然而这种技术存在双刃剑效应:既能帮助用户获得更好的AI回应,也可能被恶意利用。更值得关注的是,随着人们习惯对AI使用心理操控技巧,这种行为模式可能会蔓延到人际交往中。
这项来自斯坦福大学等机构的研究首次将离散扩散模型应用于音频修复领域,通过将音频转换为词汇序列,实现了对长达500毫秒音频空白的有效修复。该方法显著优于传统技术,在处理音频中断、损坏录音恢复等场景中展现出广阔应用前景,为音频处理技术开辟了新的发展道路。
人工智能技术正经历重大转变,从传统的聊天机器人形态逐步向浏览器集成发展。这种趋势反映了AI应用场景的扩展,用户可以在浏览器环境中直接体验智能功能,无需依赖独立的聊天界面。浏览器作为用户日常工作的核心平台,为AI提供了更广阔的应用空间和更自然的交互方式。
布里斯托大学和Memories.ai Research联合开发了UGC-VideoCaptioner,这是首个专门针对短视频音画同步理解的AI系统。该研究构建了包含1000个TikTok视频的基准测试,采用创新的两阶段训练策略,仅用2000个样本就达到了传统方法需要20000个样本的效果。实验显示该模型在音频理解、视觉识别和综合描述生成方面都有显著提升。
电商平台Pietra推出AI助手套件,旨在帮助创始人管理品牌运营的复杂性。这些AI工具可处理供应商联系、库存跟踪、营销推广、订单履约和数据分析等电商核心环节,全年无休运转。系统通过品牌数据库积累知识,将原本需要6-12个月的供应链流程缩短至48小时。创始人可专注创意决策,让AI处理繁琐的后台操作,从实习生水平逐步成长为高效助手。
康奈尔大学和希腊伯罗奔尼撒大学的研究团队开发了一种新型AI协作框架,让多个AI代理像人类团队一样互相信任和协作。通过建立信任评估机制和重新思考流程,在苹果叶片疾病诊断任务中,系统准确率从48.13%提升到85.63%,相对提升77.94%。这种方法无需额外训练即可大幅提升AI性能,为多代理AI系统的发展提供了新思路。