我续费了,为啥文心一言要收费吗4不能用?

“有多少智能,就有多少人工”。戏谑的话藏在人工智能背面,目前为止依然成立。刚从大学里走出来的丁洋,前途暂时踩在这后半句上。丁洋大学时学的轻化工程,毕业后系里同学的去向大多是三班倒的造纸厂,他不想去工厂。今年6月份毕业后,丁洋从回到海口,8月初拿着一本电子版训练题库,两天后成为文心一言的“新手”数据标注员。海口市秀英区的招商局大厦,文心一言的数据标注员们习惯把这里叫做“基地”。两百多人在这个基地进出,分布于这桩写字楼的其中三层,入职前要签保密协议,进门要刷脸,一人一台电脑,不少电脑还是老板从山西租了运过来的,因为在当地租这些设备熟人不多。“这电脑买来500块钱都不用,我有次把主机拿去闲鱼上搜——就值60块钱。500块我能装一个比这好得多的。”丁洋高考时候报的计算机,后来被调剂到了轻化工程,但他感兴趣的不是这个,反而在大学时看了很多计算机和软件工程的东西,这也让他在去年年底很快听说了ChatGPT的出现。12月,他注册了个ChatGPT账号,然后“能力比较超出我的预知”,他说。图源:品玩我在基地的工位碰到丁洋的时候,他眼前电脑屏幕上的问题是:“成功人士的标准是什么?”这可能是某位文心一言用户的真实问题,也可能是凭空生成的一个测试题,但摆到屏幕前了,需要被标注。标注并不容易。一个这样的问题下面会有五个文心一言给出的不同回答。数据标注员要看完,然后把每个回答里所有的瑕疵都找出来。比如回答中的错别字或者“因为”“所以”之类的逻辑词错用,但更多是答非所问,或者某段话里出现了完全没有事实依据的所谓“幻觉”。他要给这五个答案按回答质量打分,满分5分,一共五档,最低1分。3分及以下的回答,丁洋需要把每处错误各自划分到标注系统给出的不同错误类型里。这复杂的纠错过程是在训练生成合适的奖励模型RM(reward model,也叫偏好模型),打分和排序的动作会让模型进一步与人类的偏好对齐。这也是ChatGPT的取胜钥匙,OpenAI的论文中曾描述过这个在指令微调(Instruction tuning)过程中让人工智能向人类想法对齐的过程。在数据标注员的工作之前,需要一些更专业的人员把发散的语料变成具体的问答对,然后像例题一样喂给大模型,后者在大量问答对的数据训练之后得到优化后,开始自己答题。数据标注员在这一阶段为大模型生成的答案质量从安全性、准确性、相关程度等角度做出评价,这些评价数据进一步训练出一个奖励模型。最终这个奖励模型会代替人工标注的工作。OpenAI超过300亿美元的估值背后,是大量时薪不到2美元的肯尼亚数据标注劳工,要不然它在去年12月也到不了丁洋面前。但丁洋并不知道RM或是SFT之类的定义,他说上手前的培训中没有这些过于理论的内容,这里甚至有人不知道自己为之工作的文心一言是什么。但这不要紧,要紧的是把事情做完。这份早九晚六,做六休一的工作,底薪1800元。一个月下来,如果平均每天能标注够40道题,底薪就拿到了。底薪按完成率算,提成则要把正确率也考虑进去。多来一段时间的“老手”的稳定工作量是一天7、80个,遇到的问题难度也高些。平均下来,一个月可以拿到4000元,如果努力一点,比如每天标注100道题左右的话,一个月可以拿到7000元。对于丁洋这样刚毕业的学生来说,4000元算是一份起步不低的工作。海口人平均月工资只有3000元出头,甚至10个人里有6个人一个月拿不到3000元。本地有名的后安粉要卖11元,ChatGPT的标注员干一个小时能买一碗。相比之下,粉算贵的。按他的话说,海口人钱赚的不多,但在吃东西上舍得下手。图源:品玩“股票是最难的,或是汽车”,丁洋说。碰到这方面的问题一道可能就要花20分钟。“比如会有人问是该买宝马3系还是奔驰C系”,这时候大模型会把关于两款车的80多个参数统统列出来去给用户比较,他就得跟在屁股后头去一一核实每个参数的真实性。工作半个月也标注了大几百道题了,但他说自己印象里能拿到3分就已经不错,鲜有4分的。他记得一道拿到4分的题,题目是“林黛玉为什么要打白骨精?”文心一言没顺着竿爬,反应过来打白骨精的不是林黛玉,然后再介绍了林黛玉和白骨精各自的人物背景。从回答质量的各个维度来看,这都几乎无可挑剔。我把这个问题提给了Claude 2,它说:“白骨精化身为王熙凤多次羞辱林黛玉,林黛玉对白骨精的戕害感到愤怒。”——幻觉这件事确实够麻烦的。图源:品玩2020年初,“人工智能训练师”正式成为职业并纳入国家职业分类目录,两年后大模型的浪潮突然在这个目录上划开一个更大的口子。眼看着人工智能拿走人类的旧工种,然后寄希望于它会创造出新的。就像那个马车被汽车取代,新工业会给马车车夫一个劳动致富新世界的笼统比喻,大把揣着钱找标的的投资人对这个说法买账,也有人不买,比如曾经奠定深度学习基础,现在却忧心忡忡的英国人杰弗里·辛顿。但眼下最直接的创造就是丁洋这样的大模型数据标注员。在2022年之前,那个人工智能前沿阵地仍然被驾驭不了自己的自动驾驶所定义的时期,对于数据标注员有一个冷冰冰的比喻:“如果你把AI看成动物的话,数据标注员的工作大致就相当于准备饲料。”这个工作便宜,重复——甚至够不上是个喂饲料的。一个传统的数据标注员,每天的工作仅仅是仔细地观察每张接收到的图像,圈出一辆汽车或者一只狗的轮廓,打上标签,拖放到不同的文件夹里;或者用点阵工具将一段行驶录像中每一帧画面里的障碍物标记出来,留出一个完整的“可行驶区域”。这样的动作一位数据标注员一天可能要做2000次。只有经过标注的数据才能被人工智能学习。一家自动驾驶数据供应商曾表示,数据标注发展至今,自动化的程度仍然只有5%,另外95%的标注工作仍是以人工完成。大模型来了之后,数据标注这个工种本身也开始变化。不只是对着屏幕简单的拉框、描点或者划线,大模型数据标注员主要的工作变成对生成内容的评估、排序和打分,如果涉及多轮对话或是多模态的内容生成,难度又陡增。如果说传统CV和NLP时代的模型标注更倾向于按照客观规则行事,大模型的标注规则要主观的多,也更考验标注人员的素质。也因为这样,百度在海口和山西的大模型标注团队里全是本科以上的。海口基地里的普通标注员有机会晋升为质检员,再往上可以做培训师,再做主管,最后则是项目经理。这是一条几个月内建立起来的通道。一位在海口为文心一言做数据标注的代理商表示,过了试用期后,内部有岗位就可以晋升,没有时间线。这是个极速成型的新行业。“每一个环节上都是新人”,丁洋说。质检员做完第一道审核后,会把题库交给第二道审核。第二道审核是百度内部来审,这些训练数据也就脱了丁洋所在标注团队的手。为文心一言工作的丁洋和整个基地的200多人,算不上是百度的员工。海口基地里的标注人员归属于四个不同的代理商。他们的劳务合同是和这些第三方数据标注公司签的。这是这个岗位的惯例,百度从搜索到自动驾驶到大模型的漫长人工智能历史,背后是全国超过600多个代理商,遍布300多个城市的20万数据标注人员。百度给自己大模型专职团队的规模预设接近万人,这个计划将会兑现成未来全国十多个城市的新的“基地”。百度智能云数据标注基地业务产品负责人胡驰相信,大模型数据标注员将会是一个长期的职业。随着大模型能力在各个场景深入,新的问题会出现,也意味着新的标注需求会出现,人类永远需要这样一种勤勉的对齐方式。丁洋说,他会离开这儿的。和他同一时间进来的新手数据标注员有20多人,很快已走了大半——多半是主动离开。工作内容的枯燥、计件工资的赚钱方式、对人的消耗,不难想象这会是个高流动性的岗位。而且不管再怎么有人叫好,人被机器取代的不安全感就在那里,这是所有人喜闻乐见的。丁洋把这里看作一个能跟着这个产业一起成长的机会。“试试看能不能做到主管”,他说,然后去找一个离这场人工智能浪潮更近的位置。(文中丁洋为化名)
@@=value.title$$
@@=value.author$$
@@~$$
公众号新浪科技新浪科技为你带来最新鲜的科技资讯苹果汇苹果汇为你带来最新鲜的苹果产品新闻新浪众测新酷产品第一时间免费试玩新浪探索提供最新的科学家新闻,精彩的震撼图片
百度的文心大模型,肯定算得上是中国AI大模型第一梯队的代表之一了。并且,国内第一梯队AI大模型厂商,目前应该屈指可数——包括了百度、字节跳动、科大讯飞、智谱AI,等等。说不好的话,科技大厂做通用大模型有着天然的优势(长期目标是通用人工智能AGI),在数据、资金、人才、场景、信誉等多方面占优,而初创公司若是不能像OpenAI那样实力超群、出类拔萃,尽可能快人一步、占得先机,那么最终很可能会被市场淘汰出局,从资本那里融来的钱也大概率会打水漂。10月17日,百度发布了文心大模型4.0,号称“是迄今为止最强大的文心大模型,综合能力与GPT-4相比毫不逊色”。百度透露,文心大模型3.5自从8月31日向全社会开放以来,用户规模已经达到了4500万。再结合第三方提供的数据来估计,相比其他国产大模型,百度文心一言在国内的用户总数应该暂时处于领先地位。11月1日,百度又一次抢跑国内其他AI大模型厂商,正式推出文心一言会员付费的服务模式。用户要想使用文心一言4.0,只能开通付费使用。用户可选的付费方案有三种:一是连续包月会员,每月费用49.9元;二是单月购买会员,每月费用59.9元;三是文心一言会员+文心一格白银会员,每月费用99元。众所周知的是,OpenAI的GPT-4是当前全球技术最为领先、功能最为丰富、实用性最强的大模型,每月向用户只收取20美元的费用。如果按照人民币与美元的汇率换算,那么20美元约合146元人民币,文心一言4.0收费显然要比GPT-4便宜了不少。但是,如果按照美国货币购买力是中国的3倍来算,那么20美元相当于60元人民币,于是文心一言4.0收费并不比GPT-4便宜多少,甚至还要比GPT-4更贵——文心一言会员+文心一格白银会员,每月费用99元。理论上,AI大模型的商业前景和市场潜力是非常诱人的!若是文心一言4.0现在就能全面匹敌甚至超越GPT-4,那么仅在中国就非常有希望赢得数千万甚至上亿人开通会员付费——全年为百度创造收入上百亿元人民币乃至更多,是完全可能的。就以百度自己公布的数据为例,当4500万用户都选择连续包月付费的方案使用文心一言4.0时,则一个年头下来百度将可以获得会员收入大概是270亿元人民币,在百度总营收中占比至少20%。再进一步,百度将文心一言4.0大力推向海外市场,同样能够获得许许多多的付费用户,同时伴随收入规模的扩大。因为,既然文心一言4.0都能媲美GPT-4了,那就意味着能给人们带来实实在在的帮助,人们自然觉得这样的付费是值得的。接下来该讨论的问题是,百度文心一言4.0值得广大用户付费使用吗?对此,不妨将文心一言4.0和GPT-4放在一起对比。考虑到文章的篇幅不宜过长,就让文心一言4.0和GPT-4在图像生成、代码编写、文案创作和数理运算共四个方面进行比较。首先是图像生成。对于很多行业的人来说,让AI大模型将文本生成图像,在现实中有着很大的需求。AI大模型仅是将文本生成图像的功能做到足够强大,就必定可以赢得很多很多用户的青睐和付费——前提是定价尽可能亲民。让文心一言4.0和GPT-4分别生成图像,文本提示为:1)一只名叫阿悟的小熊猫兴奋地站在一片花丛中,眼睛闪着光芒,耳朵竖立,注视着一群蜜蜂在花间飞舞。蜜蜂的细节被突出显示,一些正忙碌地采蜜,而一条蜜蜂飞行的轨迹引领着阿悟的视线朝向一个未知的方向。2)一个夏天的早晨,一只可爱的大熊猫在厨房烹饪蛋糕。文心一言4.0GPT-4对比的结果是:对于第一个文本提示,可能是因为“有点复杂”,文心一言4.0直接说自己无法生成图像;对于第二个相对简单的文本提示,文心一言4.0就能生成相应的图像,只是图像的质量和效果等很难令人满意。相比之下,无论是复杂的文本提示,还是简单的文本提示, GPT-4+DALL-E 3组合都生成了高度契合文本提示的图像,而且图像的质量和效果等都足够好。尤为值得补充的是,GPT-4+DALL-E 3组合还解决了生成图像一致性问题,使得文本生成图像的实用价值提升到了新的层次。换句话说,用户可以选择某张由GPT-4生成的图像,通过询问GPT-4该图像的“种子”,基于该图像的“种子”继续生成带有相似元素的图像。比如,用户觉得某张图像中某个的人物形象很棒,那么就可以用这个人物形象创建新的图片。比如,这个人物形象可以爬山、可以钓鱼、可以滑雪、可以游泳,等等。其他不再举例,用户可以自行举一反三。GPT-4其次是代码生成。对于现实中很多人来说,要想跟得上这个时代前进的步伐,计算机编程似乎是一项必须掌握的技能,就像人应该学习语文、数学那样。不一定非要干程序员的工作,但初级的代码编写能力最好是自己要有。能否像专业的初级程序员,或者中级程序员那样根据文本提示编写可以运行的程序代码,是衡量AI大模型能力很重要的指标之一。Python算是一门比较容易学会的编程语言。所以,这里就以Python编程为例,让文心一言4.0和GPT-4分别编写代码,以实现一个动画。当然这个编程题目是有定难度的,它涉及到了数学模拟等等。文本提示为:1)编写一个Python程序,使用matplotlib库来创建一个简单的太阳系动画。太阳系模型应包括太阳和至少三个行星(例如地球、火星和木星)。每个行星应围绕太阳按照不同的轨道半径和速度旋转。要求:1, 用圆圈表示太阳和各个行星,大小按比例设定。2, 每个行星的轨道应该是一个圆形,轨道半径根据实际太阳系的比例来设定。3, 行星围绕太阳旋转的速度也应当根据实际的轨道周期比例来设定。4, 动画应该是无限循环的,行星在轨道上的运动应该是平滑的。5, (可选)为动画添加背景,例如星空或其他科幻风格的背景。文心一言4.0运行文星一言4.0所写代码后的结果GPT-4运行GPT-4所写代码的结果是个动画(截图1)运行GPT-4所写代码的结果是动画(截图2)对比的结果非常显著:文心一言4.0编写的代码存在问题(需要人为修改),通过运行它写的代码没能出现符合题目要求的动画。再来运行GPT-4编写的代码,便出现了一个简单的太阳系动画,包括一个太阳和三颗行星,三颗行星都围绕着太阳以不同的速度做圆周运动。事实上,即使让一个学会了Python语言的人来编写这样的代码,也未必能够成功写出足够简单、正确且可运行的代码。再就是文案创作。目前国内外很多的AI大模型,都能够帮助用户辅助创作文案,只是能力有大小之分、水平有高低之分。用AI辅助创作各种各样的文案/文章,几乎是任何用户都会用到的功能,因为用户使用该功能所需要的知识学历门槛相对很低。按理说,在文案创作方面,文心一言4.0跟GPT-4相比的差距应该不大才对。让文心一言4.0和GPT-4分别润色同一篇短文,文本提示为:1)请给以下文章润色!特斯拉作为全球首屈一指的纯电动汽车大厂,目前为止仍是依靠Model 3和Model Y这两大爆款车型推动生产量和交付量持续增长。而即将在全球发售的电动皮卡Cybertruck很有可能成为特斯拉又一爆款车型。该款电动皮卡在尚未正式交付之前,全球预售订单总量就已经高达惊人的两百万辆左右。Cybertruck从2019年11月首次亮相以来,便一直是全球最受关注的车辆之一,原因不言而喻。这款赛博皮卡拥有与众不同的不锈钢角形外观,与其他任何车辆都不同。况且,按照特斯拉首席执行官埃隆马斯克所说,该款皮卡具有出众的性能。从互联网上流传的信息来看,预计进入2024年后,Cybertruck才会开始大规模生产。日前,由一辆Cybertruck牵引着一台猛禽发动机的视频和图片,在社交媒体X平台上传播开来。无论视频还是图片,都能给人带来视觉上的震撼效果。一方面,Cybertruck的车身长5.88米,宽2米,高1.9米,四电机版本的牵引力达6.8吨,百公里加速时间少于2.5秒,包括拖拽能力和加速性能等等,均大幅超越现行皮卡车。这款带有未来科幻主义风格的Cybertruck,不仅被誉为特斯拉最棒最酷的车型,更是以外骨骼造车理念重新定义汽车制造,推动造车行业突破工程难题。另一方面,真空版猛禽发动机的长度4.6米、直径2.3米,推力369吨,燃烧室压力350巴,比冲363秒,不仅是全球首款实际量产和发射的全流量分级燃烧循环发动机,更是凭借结构简单、高效复用、造价便宜、超大推力等多重优势,为人类跨越星际时代打开了新的大门。可以这么认为,此番特斯拉与SpaceX的联动,虽然没有花一分钱的广告费,但确实是一场巧妙的营销策略。正如2018年SpaceX猎鹰重型火箭载着特斯拉轿跑Roadster飞向火星那样,让竞争对手无法模仿和超越。文心一言4.0GPT-4对比的结果是:文心一言4.0帮助润色后的文章,读起来给人的感觉比较生硬。然而,经过GPT-4润色后,该文章整体给人阅读后的效果确实更好了,几乎看不出是AI机器人写的——GPT-4在用词造句、谋篇布局等方面更有讲究、更有技巧。最后是数理运算。可以预见的是,随着AI大模型持续迭代升级,包括科学家、工程师等在内的专业技术型用户会使用AI大模型帮推理和运算,涵盖经济学、金融学、统计学、数学、物理学、化学、生物学、地理学等极其广泛的知识领域。不可否认的是,尽管GPT-4在进行数理运算时会犯这样那样的错误,有时候它连思考和解决问题的水平还比不上一个聪明的小学生——距离通用人工智能AGI还有着很长的路;但它可以自行调用插件进行推理运算,例如像wolfram alpha这样的计算知识引擎。因此,这里也就不去过分刁难文心一言4.0和GPT-4,文本提示为:1)小明和小红是邻居,他们计划一起去附近的农场买新鲜水果。小明决定购买苹果和橙子,而小红只打算购买橙子。农场的苹果和橙子都是按公斤销售的,而且价格不同。已知:小明购买了2公斤苹果和1公斤橙子,总共花费了70元。小红购买了2公斤橙子,总共花费了50元。请问苹果和橙子每公斤的价格分别是多少?如果小明使用同样的总金额去购买橙子,他能买多少公斤?2)计算并绘制函数 f(x)=sin(x)+cos(2x) 在区间 [0,2π] 的图像。文心一言4.0通过运行文心一言4.0所写代码得到的函数图像GPT-4对比的结果显示:GPT-4因为有可供自己使用的插件wolfram alpha作为辅助,它的优势显而易见。文心一言4.0有努力追赶的必要,通过引入更多的功能插件来扩展自身的能力边界。截至到今天,GPT-4的插件已经有上千款,包括增强网页搜索类插件、工具类插件、算法检索类插件、文件链接阅读类插件、商业金融与投资顾问类插件、生活饮食/住房/出行/购物类插件、音乐/娱乐类插件、小游戏类插件,等等。文心一言4.0拥有的插件就少了太多,只有8款插件可供用户选择使用。小结:文章尽可能不往长篇幅的方向写,所以免不了以偏概全。之所以这样写,不是为了说国产大模型这不行那不行,而是希望国产大模型加紧追赶。因为作为普通用户之一,GPT-4依然是最好的选择。或者说,国产大模型厂商不能将眼光局限于中国市场以内,而应该向世界数一数二看齐。只有这样,才能赢得广大用户的认可,特别是那些知识学历高、专业技能强的高知/精英用户。

2023-03-22 16:45:43
48点赞
103收藏
50评论
Hi,各位值友大家好呀,今天和大家分享一下如何利用最近火爆的文心一言工具,快速做PPT吧。写在前面:本文写作耗时2.5小时,阅读并且学会进需要三分钟,若感觉对您有用,请关注我,您的关注是我继续分享的动力。本文原理:文心一言目前的版本(发版日期:2023/03/20,版本:V1.0.1)是不支持直接生成PPT文档的,本文利用的是文心一言可以帮助不会操作markdown的群体快速生成Markdown格式的源代码,再利用其它网站将Markdown格式的源代码快速生成PPT文档。方法如下:第一步:开文心一言网站(点我进入),生成PPT大纲(我做演示使用,没有已经做好的PPT大纲,所以需生成一个,若您有写好的大纲,可以直接让文心一言生成markdown格式的源代码使用。)这里吐槽一下,文心一言不能直接用一个命令生成PPT大纲和markdown的源代码,而这一点chatgpt可以实现。文心一言需要连续对话,生成markdown格式的代码。(当然也可能是我的命令语句有问题,但我试了几次,都需要两步实现。有可以一句命令实现的值友,不妨留言处分享一下。)第二步:随便找一个可以利用markdown格式源代码生成PPT的网站,有很多,今天以 mindshow网站(点我进入)为例讲解。网站用邮箱注册后登陆既可以使用。将从文心一言上获得的PPT大纲的markdown格式源代码粘贴倒入既可。倒入后获得下图界面,可以通过左侧修改PPT的标题,演讲者信息,大纲文字等,当然这些也可以在PPT制作生成完成后修改。通过右侧下方部分,可以选择使用PPT模板(非完全免费,但免费模板也足够使用了)。如下图,我更换了一个比较适合本篇主题的PPT模板。在具体的页面设计过程中,可以通过布局按钮,对PPT的每一个页面进行独立的布局设置。系统会根据页面的文字内容,选择比较适合展现的布局模板,供你选择修改。页面修改完成后,支持在线预览。在所有页面都修改完成后,就可以下载文档了,可以根据需要,选择下载PDF格式和PPTX格式。PDF格式的文档如下图。PPTX格式的文档如下图,又回到了我们熟悉的PPT编辑页面,可以支持二次编辑文档内容,非常方便。总结:本文中利用文心一言网站的主要部分是生成PPT大纲内容和markdown格式的源代码,若您平时熟悉markdown格式写作,可以直接利用第二个网站生成PPT,不熟悉的值友可以利用文心一言工具生成使用。最后分享一本秋叶老师的关于PPT制作方面的书籍,平时可以阅读一下,还是很有帮助的。 说服力让你的PPT会说话秋叶PPT办公软件教程书让你的PPT会说话38.4元京东去购买 本期分享就到这里,下次见!觉得有用的话,别忘了关注我呀!作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

我要回帖

更多关于 文心一言要收费吗 的文章