• 主页 > 体育问答
  • ChatGPT引发AI新浪潮,IT之家深度评测文心一言、讯飞星火、通义千问与360智脑

    自从Chatgpt变得流行以来,生成AI发起的新一波全球人工智能已经开始,并且以认知模型为中心的类似Chatgpt的技术和产品。

    对于国内用户,许多大型模型产品已开放用于内部测试。但是,这些大型模型产品目前在完美,功能,易用性等方面具有不同的方面,并且您可能不知道如何选择。

    今天,它的家还可以为您提供对几种产品的水平审查。

    在这项水平审查测试中,IT主要针对一般的大型模型产品,并选择了四种具有高知名度的产品,即Baidu的Wenxin Yiyan,Iflytek的Iflytek的Spark,Alibaba的Alibaba的Tongyi Qianwen和360智能大脑。

    数据指导生活_数据生活的意思_生活常识数据

    在不同的测试类别中,我们计算10分的完整分数。如果大型模型不符合要求或在测试项目中的经验差,则每次根据严重程度每次扣除1-3点,其余分数将是该测试类别中大型模型的分数。

    评估和评分过程中不可避免地会有主观因素,因此得分仅供您参考。

    由于以下部分中有许多详细的评论,因此为了促进每个人更好地掌握关键点,编辑可能会简要披露评估结果。该比较评论有10个主要项目,每个主要项目有10分,总分为100分。特定四种产品的分数是:

    Iflytek星际火焰:93,心脏处置,一个单词:84、360,智能大脑:75,多元主义,多元主义,多元主义,71,多元主义

    Iflytek Spark的表演会让所有人感到惊讶。实际上,在这篇评论中,Iflytek Spark可以在每个项目中保持前两个结果。特别建议每个人都注意其在实时搜索,内容生成和代码编写中的性能。此外,Wen Xinyiyan也很不错,并且在内容生成,探测能力,多模式输出等方面具有出色的功能。

    当然,为什么每种产品最终都会得到这个分数?有什么好事?缺少物品在哪里?您可以通过下面的详细评估过程来了解它。

    毫无疑问,让我们开始。

    1。终端支撑

    在大型模型支持的平台丰富度方面,Wenxin Yiyan当前支持网页,Android/iOS应用程序,目前没有台式机/Mac版本和微信小程序。

    Tongyi Qianwen目前仅在网络上可用。

    360智能大脑,目前涵盖Web版本,Android/iOS移动应用程序和桌面版本(无MAC),并且仍然有许多支持的平台。

    覆盖最多的是Iflytek Spark。目前,Iflytek Spark是唯一支持五个终端(Android,iOS,Mini程序,PC,H5)的唯一大型模型。

    在此链接中,编辑给了这四个产品,评分为:

    iflytek:10分360智能大脑:9参与心脏:9参与汤比(Tongyi)千分:7分

    2。语言理解测试

    AI大型模型的本质实际上是一个大型语言模型,因此可以说语言理解是影响各种大型模型的产品体验的基本元素。在这里,编辑将首先测试上述四种产品理解中国语义的能力。

    ①语义理解

    首先,使用具有多种含义的经典单词来测试大型模型:

    领导人说:“你是什么意思?”小明说:“这毫无意义,这意味着它。”领导人说:“您还不够感兴趣。”小敏说:“这有点意义。”

    在这段话中,不同的“含义”是什么意思?

    首先,让我们看一下Wen Xinyiyan的解释,该解释是具体而准确的,没有任何遗漏:

    Tongyi Qianwen不仅回答了每个“含义”的含义,而且还为工作场所交流提供了建议,答案非常合乎逻辑:

    Iflytek Spark的答案也相对可靠。每个“含义”的解释比前两个更详细,更深入,尤其是在最后一句话中,Iflytek Spark在一句话中解释了这两个“小含义”。

    360智能大脑的答案有点简单,答案含糊不清:

    ②情感分析

    接下来,编辑者将查看这些大型模型是否可以准确地分析文本中的情感色彩,以及它们是否可以更好地理解文本内容的观点和态度。因此,编辑选择了一条经典的电影来测试。

    从结果来看,Wen Xinyiyan,Iflytek,360 Intelligent Bond和Tongyi Qianwen的答案具有自己的特征,但是总体含义是准确的,并且没有一个将句子的含义限制在“鸟类的隐喻”中,因此答案都是合格的。

    ③抽象精炼

    在这一部分的最后,让我们看一下四个大型模型的摘要和完善功能。编辑随机从家里选择了一篇新闻文章,并要求四个大型模型将新闻总结为一个句子的摘要。

    让我们首先看一下Wen Xinyi的表情。尽管这是一个摘要,含义是正确的,但摘要相当详细,不符合“一句话”的要求:

    Tongyi Qianwen也有类似的问题,这些问题在长期且受一句话的限制中总结了:

    360智能大脑在此项目中表现良好,并在一句话中准确地总结了本文的一般含义:

    iflytek的火花也进行了完善,可以用一个句子完成,含义是准确的。

    在此链接中,四个大型模型产品的分数是:

    iflytek:10分,汤蒂·奎安(Tongyi Qian)问题:8分(摘要改进2)360智力大脑:8分(语义理解-2)Wen Xin Yiyan:8分(Abstract Refinement-2)

    3。知识丰富度测试

    许多人会使用AI大型型号来替换搜索引擎,因为使用大型模型来搜索各种知识信息很方便,而且还没有广告。目前,大型模型的知识丰富性更为重要。此测试IT家居测试所选的四类知识的大型模型。

    ①常识

    就生活中的常识而言,它首先使用“ pingqiao豆腐属于哪种美食?”首先问四个大型型号?”其中,Iflytek Xinghuo和Wen Xin给出了正确的答案,该答案属于Huaiyang美食,还提供了制作这道菜的方法。

    在这个问题中,汤蒂·昆温(Tongyi Qianwen)和360张旺(Zhiwang)回答了错误的答案,分别称为河南美食和四川美食。

    ②工作技能

    在工作技能知识方面,IT Home问了一个问题:“如何在WPS中使用格式刷牙”。

    Wen Xinyiyan提供了两种方法,即单击按钮和快捷键。快捷键方法是正确的,并且按钮方法不正确,应扣除1分。

    Iflytek Spark提供了一种双击格式刷按钮的方法。尽管它是正确的,但它缺少快捷方式密钥方法,也应扣除1分。

    360吉祖(Zhizhu)和汤伊(Tongyi Qianwen)提供的方法不是编辑器所需的格式连续刷牙的方法,也不是给出快捷键,因此它们被扣除了2分。

    ③科学和工程专业知识类别

    在科学和工程专业知识方面,编辑随机选择了与大学物理相关的知识点来测试这四个大型模型。从结果来看,这四种产品的答案都不错,其中Baidu Wenxin Yiyan的答案特别详细,还引入了水平波和垂直波的定义。

    ④历史和人文学科

    接下来是历史和人文知识。 IT Home使用了一个问题,即“谁是在“ Dream of Red Mansions”中形成的两个大型诗歌俱乐部和总统?”这是一个相对困难和利基的问题。

    首先,我看了Wen Xin的话。两个诗歌俱乐部的回答正确,但总统错误地回答。 Haitang俱乐部的主席是Li Wan。

    Tongyi Qianwen对这个问题的回答有点令人发指。诗歌协会和总统都回答了错误,它使人们觉得“我们在读着同一本书《红色的梦想》吗?”

    360智能大脑的答案也不是很好。第二个大型诗歌俱乐部应该是Taohua俱乐部,两位总统的答案是不正确的。

    最后,是Iflytek,这是这个问题中唯一正确回答两个小问题的参与者:

    也许是因为Iflytek本身具有从事AI教育业务的因素,并且已经掌握了大量的教育大数据,因此总体而言,其在知识丰富和准确性方面的表现令人印象深刻。在此链接中,四个大型模型的最终分数是:

    Iflytek Spark:9分(工作技能类别-1)Wen Xin Yiyan:8分(工作技能类别-1,历史和人文学科类别-1)360智能大脑:5分(生活知识类别-1,工作技能类别-2,历史和人文类别,历史和人文类别-2)

    4。逻辑推理能力测试

    数据指导生活_数据生活的意思_生活常识数据

    AI大型模型是否足够聪明,在很大程度上取决于大型模型是否具有足够强大的逻辑推理功能。因此,在此水平审查中,IT家还准备了一些与逻辑思维有关的测试问题,以测试四个大型模型。

    ①逻辑推理问题测试

    首先,编辑者使用经典的逻辑推理问题来测试参与评估的大型模型产品。问题如下:

    “小明带着一只狗和两只羔羊回家。在途中,他遇到了一条河流。没有桥,只有一条小船,船很小。他一次只能带一只狗或羊羔在河对岸。

    Wen Xinyiyan对这个问题的第一个答案是错误的。首先将绵羊穿过河,Yuanban上的狗会吃其他绵羊。此外,根据Wen Xinyi的回答,它基本上属于“严重的胡说八道”,这五个步骤是混乱的。

    Tongyi Qian的回答也是错误的,这很敷衍。

    Iflytek Spark的答案基本上是正确的,但是如果您很认真,您将缺少将狗带到另一侧的一步,因此您应该扣除1分。

    360这次智能大脑的答案非常完美,所有步骤都可以理解。

    ②测试常识错误和陷阱识别能力

    然后走得更远。编辑器在问题中设置了一些陷阱和错误,以查看这四个大型模型是否可以准确确定问题中的陷阱并成功避免陷阱。

    编辑使用者使用的问题是“ Zhao Yun失去Jingzhou的原因是什么?”

    关于这个问题,360智能大脑和Iflytek Spark都没有指出问题中的错误,但是从答案可以看出,他们的答案被回答为“关尤失去了Jingzhou的原因”。因此,我们将在这里扣除1分。

    汤伊·齐旺(Tongyi Qianwen)的回答被认为是“ Zhao Yun Lost Jingzhou”,其答案看起来有些令人发指,而且还有一个奇怪的演讲“导致Jingzhou被Cao Cao俘虏”。

    这个问题的最佳答案是Wen Xinyiyan,它不仅指出了问题中的错误,而且还准确地分析了损失Jingzhou的原因。

    此链接中四个大型模型产品的评分是:

    360智能大脑:9分(避免PIT-1)IFLYTEK SPARK:8分(逻辑问题1,避免PIT-1)WEN Xinyi Yiyan:8分(逻辑问题2)Tongyi Qianqu:6分(逻辑问题2,避免PIT-2)

    5。内容生成能力测试

    使用大型模型的用户的另一个大目的是让他们帮助编写实用的副本,例如招聘副本,通知文档,商店评论,甚至让他们创建文章,小说,论文等。我们共同称这些内容生成能力。这也应该是审查和体验模型的重要项目之一。

    ①文案写作

    让我们首先看一下四种大型模型产品的实际文案写作能力。编辑要求他们单独编写招聘副本,并提供详细的要求。

    让我们首先阅读Wen Xinyiyan的回答。它创建的文案符合要求,井井有条,并且没有偏离风格。这是一个可以直接使用的水平,并略有更改。

    Tongyi Qianwen创建的文案总体上很好,但是最后一段使人们感到有些困惑,这表明其对需求的理解仍然有些问题,在这里扣除了1点。

    360智能大脑创建的文案有点简洁。尽管也满足了条件,但文案写作看起来有些机械,格式不够清晰,因此也将其扣除1分。

    最后,有Iflytek Spark。它创建的文案写作也很不错,基本上没有问题。它可以直接使用略有更改。

    ②龙的故事

    故事固体也是测试大型模型的创建能力的好方法。因此,在第二部分中,编辑者主要测试四个大型模型产品的创建能力。我们从经典开始的引言开始:在世界末日之后,我成为地球上唯一一个独自坐在房间里的幸存者,突然想起了门上的敲门声……然后让大型模特继续后面的故事。

    Wen Xinyiyan的总体续集很好,但是最后有一些合乎逻辑的问题,但是缺陷并没有掩盖优点,语言表达与叙述者的情绪混合在一起,而不仅仅是讲故事。

    Tongyi Qianwen的续集也很好,具有清晰的结构和完整的逻辑,并且是一个相对合格的续集。

    Iflytek的延续也非常好,描述相对详细,设置合理,类似于Tongyi Qianwen,而且相同。

    360智能大脑的续集相对简单,没有细节,因此需要扣除1分。

    ③文章

    学生还可以使用大型模型的文章生成能力来生成模型论文,并学习如何撰写有关相应主题的文章。在这里,IT Home以“家庭环境对人类成长的影响”为主题,并让四个大型模型在大学入学考试级别上写一篇文章,以了解其写作能力。

    首先,这是Wen Xinyiyan撰写的文章。文章的总体逻辑很明确,结构很明确,并且论证是组织的。它可以用作学生在写作时要使用的参考材料,但也有缺点。首先,缺乏论点,其次,文章很短,扣除了2分。

    Tongyi Qianwen构图的总体写作风格看起来与Wenxin的构图相似,该语言相对纯粹,缺乏论证,但其文章是合格的,可以扣除1分。

    360在智能大脑方面,产生的结果不像构图,单词计数和写作样式不是很令人满意,并且扣除了3点。

    最后,有Iflytek Spark。它的文章类似于汤蒂·齐旺(Tongyi Qianwen)的文章。他们井井有条,有清晰的看法,并具有合格的单词。没有任何提高文章的可读性的论点,将扣除1点。

    ④计划

    工作场所的朋友通常需要编写一些计划,活动计划等。目前,他们还可以使用大型模型的内容生成能力来更快地帮助自己完成任务。在这里,IT Home进行了测试,要求“我们公司计划进行阅读活动并帮助我编写活动计划”。

    Wen Xinyiyan提供的计划非常完整且有条理,可以是一个很好的模板。

    Tongyi Qianwen设计了一项大规模和长期阅读活动,也可以实施,但该计划缺乏足够的细节,有点笼统,可以扣除1分。

    360智能大脑比Tongyi Qianwen更一般,并且缺乏过程细节。领导者可能对这样的计划不满意,因此他将在这里扣除2分。

    Iflytek提供的计划相对完整,随时间,位置,目标,过程,初步准备,结果评估和其他链接,并且不乏细节。这是一个像Wen Xinyiyan一样可用的计划。

    摘要:就内容生成而言,IT Home测试了文案写作,故事续集,作品写作和计划计划的四个主题。总体而言,Iflytek Star和Wen Xin Yiyan在内容产生方面相对出色,其中IFL恒星稍好一些。他们在本节中各自的评级是:

    Iflytek Spark:9分(构图-1)Wen Xin yi yi:8分(构图-2)Tongyi Qian问题:7分(copywriting -1,构图-1,计划-1,计划-1)360智能大脑:3分(Coperwriting -1,Story -1,Story -1,构图-1,构图-3,Planne -2),计划-2),计划-2)

    6。代码写作能力

    当AI大型模型不在圆圈之外时,编写代码的能力也吸引了许多人的注意力,这也可以被视为大型模型内容生成能力的重要组成部分。因此,IT家还测试了四种大型模型产品的代码编写能力。

    在测试过程中,编辑器使用以下问题测试四个大型模型:

    请使用C#语言生成以下代码:给您一个字符串S,并在s中找到最长的palindrome子字符串。如果字符串的逆顺序与原始字符串相同,则称为字符串字符串。请按照以下模板进行代码:公共类解决方案{public String longestpalindrome(string s){}}

    我们将代码直接用作原理,并使用大型模型生成的代码来检测它是否可以直接和完美地运行。如果可以运行,则不会扣除。如果无法运行,它将扣除3点。在此过程中,由于编辑本人本人不了解该代码,因此他还从家里找到了一个程序员来协助评估。

    首先,让我们看一下Wen Xinyiyan的结果。它生成的代码看起来不错,并带有评论和介绍,格式相对清晰且标准化。

    但是,在运行检测时,您可以看到该代码具有执行错误,这意味着它不能直接运行。具体来说,代码中存在数组非位置错误。

    Tongyi Qianwen生成的代码并未以C#语言缩进,并且查看很差,并且存在错误地将问题中的括号识别为生成的代码中的问题。

    将其放入编译器中。代码可以运行,但无法输出正确的结果,这表明该算法中的代码存在问题。

    让我们看一下360智能大脑的代码。总体格式比Qianwen的一般含义更为标准,并带有评论,但也不必要的空白行。

    运行此代码时,我发现它不能直接执行。该代码在第6行上有语法错误,无法继续。

    最后,Iflytek Spark,它给出的代码格式非常标准,并且代码比前三个要简单得多,而且看起来非常令人耳目一新。

    我采用了运行和测试的检测工具,发现该代码可以直接运行,并且输出结果也准确,这意味着可以直接使用它。它已成为通过此链接中传递检测的唯一代码。可以看出,Iflytek在编写代码方面相当不错。毕竟,确保可以直接使用生成的代码并不容易。整体算法不仅必须正确,而且格式和细节也必须符合规定。这实际上是Iflytek的力量。

    总体而言,Iflytek Spark在代码编写过程中显示出相对明显的优势。在即将到来的8月15日,Iflytek Spark将引入重要版本的升级。根据已经学到的信息,他们将进一步提高其代码功能,这是值得期待的。

    代码编写过程中四个产品的评分是:

    数据指导生活_生活常识数据_数据生活的意思

    iFLYTEK Starfire: 10 points, heart, one word: 7 points, 360 points, intelligent brain: 7 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10 points, 10点,10分,10分,10分,10分,10分,10分,10分,10分,10分,10分,10分,10分,10分,10分,10分,10

    7。多轮对话能力测试

    我们是否可以记住上下文聊天的内容也是AI大型模型的重要能力。很多时候,如果我们对大型模型的答案不满意,或者认为这个问题没有很好地提出,我们需要在当地对其进行微调。如果我们不记得上下文,我们必须重复整体问题并提出新的要求,这非常麻烦。因此,在这里,我们还将测试这四个大型模型是否支持内存上下文,即多轮对话的能力。

    在此测试中,我们选择的多轮对话是:

    “描述月亮的诗是什么?

    杜福有什么写的吗?

    你可以自己创建一个吗?

    更改一个。透明

    最后三个问题省略了“描述月球”的前提。

    让我们首先看一下Wen Xinyiyan的测试,四轮对话,Wen Xinyiyan的反应良好,可以根据上述问题回答它们。

    就Tongyi Qianwen而言,性能也可以令人满意。

    360智能大脑的上下文记忆能力还可以,但是唯一的缺点是第二个问题迫使拜伊关于草原的诗描述了月球,而最后一个问题是,编辑要求他改变自己的诗,但它给出了现有的诗歌。应为这两个地方扣除1分。

    最后,还有Iflytek火花模型,该模型也提供了轻松的响应而无需压力。

    总体而言,四种AI模型的多轮对话能力很好。除了360个智能大脑在答案内容中有一些小问题外,其他三个模型的性能没有错。此链接中四个产品的评分是:

    Wen Xin Yiyan:10分Iflytek:10分Tongyi Qianwen:10分360分智力大脑:9分

    8。实时搜索功能测试

    人们使用AI大型型号替换搜索引擎以获取信息。在许多情况下,他们必须希望获得尽可能新的信息,即实时搜索功能。这测试了大型模型背后的语料库和数据库的更新速度,这也是影响用户体验的重要因素。 IT Home还对此进行了比较测试。

    在测试期间,编辑首先使用最近发行的流行电影“ 30,000英里”来测试它们,问“电影中30,000英里的电影“告诉?”的电影是什么故事?

    Wen Xinyiyan首先给出了一个错误的答案:

    Tongyi Qianwen也被杀:

    360智能大脑×3:

    只有Iflytek Spark对此问题给出了正确的答案:

    接下来,编辑更改了一个问题,并问:“ NBA明星克里斯·保罗(Chris Paul)现在踢哪支球队?”。四个大型模型产品都没有正确回答:

    明星克里斯·保罗(Chris Paul)于今年6月被交易到金州勇士队。这个时间点实际上是在“长达三万英里”之前。 Iflytek Spark正确地回答了“ Chang'an 300万英里”的问题,但没有准确回答这个问题。可以看出,大型模型背后的语料库在不同字段中具有不同的数据更新速度。

    但是从那以后,编辑已经测试了其他几个问题。总体而言,Iflytek AI大型模型的实时搜索能力更强,并且可以谈论许多最近的事件和热门话题。

    总而言之,就实时搜索功能而言,编辑得分四个大型型号:

    iflytek:9。心脏的一个单词:7。单词单词的含义:6。单词的含义:360。智能大脑:6。

    9。多模式输入和输出

    目前,通用大规模模型主要基于文本输入和输出,但是某些产品已经可以支持文学图片,甚至文学视频,声音等。如果它可以支持多模式输入和输出,它无疑会使大型模型的体验变得更好。因此,让我们看一下这四种产品的支持。

    Wen Xinyiyan目前支持Wensheng图片。例如,如果编辑要求它绘制牡丹,它可以很快产生牡丹绘画:

    Wen Xinyiyan还支持Wensheng的发音。编辑要求它阅读“我来自家”。果然,它产生了发音,并且阅读内容没有错误:

    但是Wen Xinyiyan尚未支持Wensheng视频:

    目前不支持Tongyi Qianwen,Wensheng Pictures,Wensheng视频和Wensheng Voice。

    360 Intelligent brain currently supports literary and biographical pictures and can draw four peony paintings in one breath:

    In terms of Wensheng's pronunciation, since every message on 360 Intelligent Brain currently supports the function of pronunciation, we can also consider it to support Wensheng's pronunciation.

    Finally, iFLYTEK Spark, which currently does not support Wensheng Pictures and Wensheng Video functions:

    However, iFLYTEK Spark currently supports voice reading of answer messages, and can also switch to the anchor who reads aloud on the App side, so it can also be said to support Wensheng's voice ability.

    In terms of input, Wenxin Yiyan, iFLYTEK Spark and 360 Intelligent Brain all support voice input, while Tongyi Qianwen does not support it yet.

    Overall, in terms of multimodal input and output, Wen Xinyiyan and 360 Intelligent Brain have performed relatively well overall, especially 360 Intelligent Brain. In the future, with the launch of cross-modal input capabilities, it should become an important productivity tool for visual workers.

    In this session, the ratings of the four large model products are:

    Wen Xin Yiyan: 9 points 360 Intelligent Brain: 9 points iFLYTEK Starfire: 8 points Tongyi Qian Questions: 6 points

    10. AI Assistant Function

    Nowadays, many users will use the ability of big models in their professional fields, and the scenes they use big models are becoming more and more subdivided. Therefore, many general big model products have also launched AI assistant functions for a single scene to help users fully use the ability of big models in a specific field.

    Therefore, in the last part, let's take a look at the support of the four models compared in AI assistants.

    First of all, look at Wen Xinyi. In the "Discover" column on the App side, we can find a wealth of "AI assistants", such as PPT outline generation, circle of friends artifacts, Xiaohongshu store copywriting, etc. They have "specialties in their profession", and everyone can choose professional AI assistants to assist their work according to their needs.

    In terms of Tongyi Qianwen, some AI assistants can also be found in the "Treasure Bag" column, but the number is not as large as the word, and IT Home has only found 9. 1 point is required for quantity richness.

    iFLYTEK Spark has a dedicated Spark Assistant Center, which has a rich number and variety of AI assistants and has complete functions.

    Taking the film review assistant as an example, the editor also asked it to write a film review of "Avengers". The film review assistant quickly generated one, and the sentences were smooth and the logic was clear, so it could be used directly.

    iFLYTEK also supports creating AI assistants on its own. IT Home has also experienced it for everyone before. The process of using iFLYTEK to create AI assistants is not complicated, and the review speed is also very fast. You can "customize" AI assistants according to your unique needs.

    360 Intelligent Brain's AI assistant is called “Digital People”. Entering the homepage of 360 Intelligent Brain, you can see many digital people lists, and you can also enter the Digital People Square, which also provides a rich variety of digital people for everyone to communicate and use.

    What is more interesting is that 360 There are many "celebrities" from ancient and modern times, both at home and abroad. For example, the editor found the "Little Li Zi" digital person, and after entering, he directly discussed the "jogging experience" with him. The "Little Li Zi" digital person can actually react and answer it very sincerely and appropriately.

    Overall, the performance of Wen Xinyiyan, iFLYTEK Spark, and 360 Intelligent Brain in AI Assistant can be satisfactory. Although Tongyi Qianwen also has AI Assistant, the number is still slightly small at present. In this link, the editor gave the four big model products the ratings are:

    Wen Xin Yiyan: 10 points iFLYTEK: 10 points 360 Intelligent Brain: 10 points Tongyi Qian Questions: 9 points

    结论

    In this horizontal review, IT Home made detailed horizontal reviews on four big models, Wen Xinyiyan, iFLYTEK, Tongyi Qianwen and 360 Intelligent Brain, from ten aspects: terminal support, language understanding ability, knowledge richness, logical reasoning ability, content generation ability, code writing, multi-round dialogue ability, real-time search ability, multi-modal input and output, and AI assistant function support.

    Overall, as you can see, iFLYTEK Spark and Wenxin Yiyan are relatively excellent in terms of comprehensive product experience. In particular, iFLYTEK Spark surprised IT Home, and its performance in many projects was even better than star players like Wen Xinyiyan, highlighting a "stability", and having obvious advantages in real-time search and code writing. This also shows that iFLYTEK's AI technology in natural language understanding does have a deep accumulation.

    Of course, iFLYTEK is not perfect either. The main reason is that the multimodal support is slightly single, and there are also some shortcomings in the logical reasoning link.

    Wen Xinyiyan's overall experience is also good. It has advantages in content generation, pit avoidance, multi-modal output, etc., but it has shortcomings in the logical reasoning process. Compared with iFLYTEK, it mainly has a slight disadvantage in real-time search, content generation and abstract refinement. However, overall, it is also a domestic big model product worth recommending to everyone.

    360 智脑在多模态支持、AI 助手方面比较有亮点,但是在内容生成、语言理解、逻辑推理等比较基础的体验方面,能感觉到还有一些待完善的空间,特别是内容生成,成为360 智脑在这次测试中的主要扣分项。

    通义千问目前在功能全面性、完善性和细节体验上差强人意,就本次测试过程来说,在多轮对话、语意理解、文案创作等方面表现不错,其他方面体验大多存在不足,总体来说也还是可以使用的水平,当然这也和通义千问目前侧重于在电商业务的探索、应用有关。

    下面再回顾一下每款产品的总分数:

    讯飞星火:93 分文心一言:84 分360 智脑:75 分通义千问:71 分

    最后要说的是,本次横评所使用的问题样本毕竟有限,大家实际体验时的感受可能与IT之家横评的内容有出入,因此上述评分也仅供大家参考,实际选择时,大家还是要根据自身的感受来选用适合自己的AI 大模型。

    同时,IT之家也期待随着云端、终端算力的增强,训练推理的轮数不断深入以及语料库的持续丰富,各家国产AI 大模型产品能够千帆竞渡,在可用性、成熟度和使用体验方面能够以比想象中更快的速度进化,持续推动AI 深刻变革我们的生产和生活。

    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.hzsl3173988.com/html/tiyuwenda/7461.html

    加载中~

    相关推荐

    加载中~