现代信息技术的高速发展打破了不少行业的时空界限,为传统行业提供了前所未有的新时空,教育就是其中之一,教、学、评、测等多个环节因为技术的推动而发生了显著的变化。而互联网背景下的移动互联、大数据、云计算等已然成为教育发展最为重要的推动力。
基于行业趋势及市场需求,不少教育学习平台纷纷涌现,腰果公考就是其中一家,与多数平台不同的是,腰果聚焦于公务员考试。近期,腰果旗下新品发布会在北京香格里拉酒店举行。此次会议以“小课程·智未来”为主题,现场正式发布了“腰果·智学小班”课程。
据悉,腰果公考基于自主研发的智学系统,在公考行业首创8人在线小班课程,满足了广大用户对于课程培训产品的更高需求。当天会议中,腰果公考的诸多强力投资方、众多媒体及众多用户、学员等悉数到场,共同见证新品课程的发布。
现场,腰果公考CEO张慧邃首先向嘉宾们介绍了当前公务员考试的现状,以及公务员备考方式的演变历史。同时他也指出“在在线教育迅猛发展的当下,网络直播大课已经成为主流的备考方式之一,但是这也无形中提高了竞争门槛,考生之间的竞争加大,想仅靠直播大课来胜出对手,会越来越困难。”所以“腰果·智学小班”应需而生,接着张慧邃为在场嘉宾全方位的诠释了“腰果·智学小班”的优势所在。
“腰果·智学小班”拥有媲美面授场景的课堂互动,支持多路音视频实时互动,同时也支持PPT、视频等几乎所有的媒体课件,拥有点名学生回答问题,组织学生进行小组讨论等互动形式,使在线课程很好的还原了地面教室的课堂互动。另外,“腰果·智学小班”还详尽的记录了课上发生的各种事件和互动细节,后续以帮助老师更合理的为学生进行个性化指导,值得一提的是,“腰果·智学小班”的老师平均教龄已超过5年,拥有十分丰富的教学经验。
除了在线课程的介绍,会上还详尽的展示了“腰果·智学小班”的练习测评模块--真题库、模拟题库、能力测验。其中真题库收录了超过5万道的公务员考试真题,并配有腰果老师独家的知识树结构和详细解析。采用了与官方命题相同的出处,并经过6道审核与试做的工序,多人多角度的钻研和筛选题目。最后,张慧邃介绍了腰果·智学小班的课外服务,课后的学习检查、1对1的职位报考辅导、三维度督学机制等都为腰果·智学小班学员的学习质量提供了强有力的保障。
主题演讲结束之后的圆桌论坛环节中,新东方在线COO潘欣、翼鸥教育创始人兼CEO宋军波、顶上英语 CEO薛淡、腰果公考CEO张慧邃对于在线小班模式进行了深入的探讨。而探讨也表明,在公务员在线培训行业发展如火如荼的当下,小班课程为广大备考的学员们提供了更多的选择方向和更优质的服务,无疑是形成在线课程差异化的一把利剑。
在如今的教育行业,充斥着众多学习平台,均是基于互联网学习方式。而大多数的学习平台需要不断创新,尊重教育规律本身,并融入信息化科技对教育资源的整合和传递方式。此次,“腰果·智学小班”的发布,代表着腰果公考作为公务员在线培训领先品牌,实现的又一次自我突破与提升。我们也期待腰果未来带给用户更多的创新与课程。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。