昆仑万维天工一刻 | 一文看懂图文多模态大模型

发布时间:2024-09-02

Image

昆仑万维推出的“天工一刻”图文多模态大模型,标志着中国AI企业在这一前沿技术领域迈出了重要一步。作为国内首款AI搜索引擎的缔造者,昆仑万维正在通过天工一刻重塑人机交互的方式。

天工一刻的核心技术亮点在于其自研的Mental Notes技术。这项创新借鉴了人类的认知过程,通过训练模型在回答问题前提供图像的详细描述,显著降低了多模态大模型常见的“幻觉”问题。在腾讯优图实验室联合厦门大学开展的全球多模态大语言模型测评中,天工一刻在综合得分、感知榜单和认知榜单上均名列前茅。

面对多模态大模型普遍面临的挑战,天工一刻展现出了独特的优势。在数据使用效率方面,其图像-文本对训练数据量不到50M,却能实现超越同类100M大模型的性能。这得益于昆仑万维团队在特定SFT数据集训练、知识定义与诱导、模型结构和训练方式等方面的创新。

天工一刻的应用场景广泛,涵盖了图像标注、文本生成和图像生成等多个领域。例如,在天工AI智能助手APP中,用户可以通过AI画画、AI识图等功能体验到强大的多模态AI功能。随着技术的不断成熟,天工一刻有望在智能客服、智能推荐、智能家居等多个领域发挥重要作用,为人类生活带来更多便利。

昆仑万维在AI领域的布局远不止于此。公司已构建起AI大模型、AI搜索、AI音乐、AI Story、AI游戏等业务矩阵,成为国内模型技术与工程能力最强、布局最全面的人工智能企业之一。其海外业务收入占比高达84%,覆盖全球100多个国家和地区,月活跃用户近4亿。

展望未来,昆仑万维正全力“All in AGI与AIGC”,致力于打造基于大模型的UGC平台。公司创始人周亚辉曾表示,2024年将是大模型的窗口期,昆仑万维正在以周为单位飞速迭代算法与产品,AI团队规模迅速扩张至近千人。在算力储备方面,公司已采购及租赁约9000张芯片,并投资AI算力芯片公司,完成了“算力基础设施—大模型算法—AI应用”全产业链布局。

昆仑万维的雄心不仅限于技术突破,更在于重塑内容产业的未来。随着AI生成内容的爆发,内容创作的门槛将大幅降低,UGC内容创作平台上的海量内容可能会淹没传统的PGC平台。昆仑万维正在积极布局,希望成为AI时代新型创作平台的引领者。

天工一刻的推出,标志着昆仑万维在AI领域的又一次重要突破。它不仅展示了中国AI企业在多模态大模型领域的实力,更为未来的智能交互提供了无限可能。随着技术的不断演进,我们有理由期待,天工一刻将为用户带来更加智能、便捷、个性化的体验,推动AI技术在更广泛的场景中落地生根。