今年春季,我参加了HPE Aruba的年度Atmosphere大会,并就他们最新的NaaS产品发表了一点自己的看法。几个月过去,客户的积极部署已经证明了该系列产品的市场成功。为此,我最近专门与零售巨头Home Depot讨论了他们同Aruba的合作关系,以及NaaS如何在改善员工/客户零售体验方面发挥重要作用。希望这段对话也能给大家带来一点启示。
Home Depot的技术愿景
Daniel Grider是Home Depot公司负责基础设施和运营工作的技术副总裁。作为一家在全美设有2000多家门店,地跨1400座城市和54个州/地区的零售巨头,Home Depot的技术运营工作显然不好做。除了极广的业务覆盖面外,Home Depot每家门店的平均规模也达到惊人的10万平方英尺之巨,意味着提供稳定的网络连接本身就是个艰难挑战。
考虑到这些现实问题,Home Depot当然有必要认真规划自己的技术部署路线。根据Grider的介绍,Home Depot的主体思路是优先关注零售体验,其次才是具体技术选型,同时强调减少客户摩擦。作为在零售业拥有多年工作经验的从业者,我个人完全同意这个基本判断。技术应该悄无声息地发挥作用,取悦客户和零售门店员工,而不是额外给他们增加使用负担。Grider先生还分享了所在部门建立基础设施的三大基本原则。首先是与能够提供单点责任和分析支持的厂商合作,确保提供无故障体验。其次是将工程师从缺乏附加价值的日常故障修复中解放出来,专注于利用自身技能为门户吸引客户。第三,考虑到网络设备资本支出巨大、IT更新周期较长等现实情况,寻求更可预测的财务计划。Aruba NaaS的拥有“即服务”类方案最引以为傲的可预测定价优势,因此特别适合Home Depot的IT更新周期。
有预料中的成效,也有计划外的惊喜
Home Depot与Aruba的合作历史可以追溯到2016年。而此番逐步走出新冠疫情阴影,推动下一轮网络更新之际,Home Depot决定先明确定义一系列预期业务成果。首先,新网络必须能够支持员工们总计超过10万台移动设备。Grider分享称,他们的计划是为每位门店员工配备食品,帮助他们随时搜索产品库存、查阅产品信息,借此提供最佳客户体验。虽然支持这么多设备绝非易事,但Aruba Central管理平台正是为这类需求而生。Aruba Central具备云原生特性,支持规模化场景并基于AI洞见提供智能线路切换功能。此外,它还提供无线门店网络支持,为Home Depot高度分散的零售体系集成威胁防御管理方案,且通过零接触配置实现了关联设备的快速激活。
Home Depot此番IT更新计划的第二大业务目标,就是把店内的网络覆盖范围扩大到大堂和各季节性波动区,解决因金属货架和产品本身造成的网络信号缺失。Aruba Central在这项工作中同样发挥着重要作用,能够从12万家客户的现有使用场景下提取匿名数据,通过分析提供快速便捷的优化建议。
这样一套精心设计的方案,也会带来不少计划之外的惊喜回报。与其他零售商一样,Home Depot在新冠疫情期间开始提供路边取货服务,而且计划在疫情消退后继续保持。Aruba则提供必要的自助服务来支持这一新用例,包括天线调谐、接入点密度和布局调整等。此外,Aruba的工具部署便捷、易于使用,只需要几小时到几天即可落实到位。
Home Depot当然可以通过传统的整体采购型基础设施达成上述业务成果。但Aruba的NaaS产品HPE GreenLake for Aruba能够显著缩短零售商的规模化转型周期,以更顺畅的IT更新流程支持财务规划、保障运营收益。将基础设施转化为运营成本,也消除了企业在极不确定的宏观经济背景下对于资本投入贬值的担忧。
总结
在访谈末尾,我拜托Grider先生为其他打算使用NaaS技术的企业提几点技巧和心得。他的建议是把地域跟财务等因素纳入考量,核算将基础设施的资本支出转化为运营支出能带来哪些好处。至于如何选择市场上多种多样的网络解决方案供应商,Grider认为需要通过磋商和试点等方式认真开展尽职调查。最后,他建议组织适当放宽投资预算,以成功部署为核心目标。从Home Depot的成功部署和高质量零售体验来看,Grider指出的这条道路确实值得参考。
好文章,需要你的鼓励
香港大学等机构研究者开发的PHYX基准测试评估了AI模型的物理推理能力,结果显示即使最先进的GPT-4o等多模态模型在此类任务上的准确率仅为32.5%-45.8%,比人类专家低29%以上。PHYX包含3000个跨六大物理领域的多模态问题,要求模型整合领域知识、符号推理和现实约束理解。分析发现模型存在视觉推理错误、过度依赖文本描述和数学公式等关键缺陷,为未来开发物理感知AI系统提供了重要指导。
QwenLong-CPRS是阿里巴巴千问文档团队开发的创新上下文压缩框架,专为解决大型语言模型处理长文本的效率和"迷失在中间"问题。该技术通过自然语言引导的动态优化、双向推理层、基于语言建模的标记评价和窗口并行推理四大创新,实现了高达21.59倍的上下文压缩率和显著的性能提升。研究表明,配备QwenLong-CPRS的小型模型甚至能超越专业长上下文模型,为高效处理海量文本开辟了新途径。
这项研究介绍了MOOSE-Chem3,一种通过模拟实验反馈进行化学假设排序的创新方法。传统的预实验排序仅依靠大型语言模型的内部推理,而该研究提出的实验引导式排序方法则利用先前实验结果来优化决策。研究团队基于三个领域假设构建了高保真模拟器,并验证了其对124个真实化学假设的预测准确性。他们开发的CSX-Rank方法通过功能聚类和反馈分析,将找到最优假设所需的实验次数减少了一半以上,即使在嘈杂条件下也表现出色,为化学研究提供了更高效的探索路径。
FullFront是一项创新研究,首次全面评估多模态大语言模型在前端工程完整流程(从设计概念化到视觉理解再到代码实现)中的能力。研究通过精心设计的基准测试,包括网页设计、网页感知问答和网页代码生成三大核心任务,发现即使最先进的模型在精细视觉感知(如元素对齐、大小和间距)方面表现远低于人类专家,且在复杂布局和交互功能实现上仍存在显著局限。研究揭示了闭源模型普遍优于开源模型,但所有模型与人类专业水平间仍存在巨大差距,为未来AI辅助前端开发工具的改进提供了重要方向。