AI大模型的语言不平等:英语最便宜,其它语言要贵得多
(资料图片)
7 月 31 日消息,用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。最近的一项研究显示,由于 OpenAI 等服务所采用的的服务器成本衡量和计费的方式,英语输入和输出的费用要比其他语言低得多,其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。
IT之家注意到,推特用户 Dylan Patel(@dlan522p)分享了一张照片,展示了牛津大学进行的一项研究,该研究发现,让一个 LLM 处理一句缅甸语句子需要 198 个词元(tokens),而同样的句子用英语写只需要 17 个词元。词元代表了通过 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)访问 LLM 所需的计算力成本,这意味着缅甸语句子使用这种服务的成本比英语句子高出 11 倍。
词元化模型(即人工智能公司将用户输入转换为计算成本的方式)意味着,除了英语之外的其他语言使用和训练模型要贵得多。这是因为像中文这样的语言有着不同、更复杂的结构(无论是从语法还是字符数量上),导致它们需要更高的词元化率。例如,根据 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中只需要两个词元,但在简体中文中需要八个词元。尽管简体中文文本只有 4 个字符(你的爱意),而英文有 14 个字符。
【来源:IT之家】
标签:
为您推荐
随机阅读
- 这个碱性菜要多吃,一清热解暑,二通便排毒,三防口臭,清爽解腻
- 【漫话大运】来!一起体验汉字之美
- 欧央行“九连加”难解通胀压力
- 都匀毛尖产地分部
- 智能网联汽车迎新“国标” 汽车智能化全面提速
- 山东济南强降雨导致一个补习班师生被困,消防紧急疏散转移
- 香蕉皮的营养价值如何(香蕉皮的营养价值怎么样呢)
- 俄外交部:美国仍在用殖民思维对待他国
- 万宁暑期“游泳热”:12所学校泳池免费开放 每天600余名学生泳池“撒欢”
- 《洛克王国》萨满阿木木基本信息介绍
- 金水区杜岭街道开展老年宣传周活动
- 惊艳!开幕式的这些“彩蛋”被我们找到啦~
- 中国代表团旗手:“排球男神”搭档“网球小花”
- 八成公司上半年业绩预喜,历史数据揭示后市上涨概率!这一行业备受政策关注
- 共享单车当废铁卖洛阳 共享单车当废铁卖
- 亿万富豪贝索斯“恋爱脑”上头,和女友订婚两月狂秀恩爱,还要和她分1500亿财产?!
- CosmosAI CMA在PancakeSwap上市后飙升100%:人工智能和计算未来可期
- jayden cool jayden cool怎么样)
- 问道未启灵的御天梭怎么获得(问道御天梭怎么获得)
- 第31届世界大学生夏季运动会开幕式举行
财经
- 亨德森沙特淘金遭口诛笔伐,队长中的队长人设崩塌
- 美国自闭症少女人间蒸发4年平安现身,警展开调查
- 金杯电工2023年上半年预计净利2.37亿 同比增加36.09%
- 住房城乡建设部:要继续巩固房地产市场企稳回升态势
- 金观平:鼓励企业敢闯敢投敢担风险
- 上峰水泥07月27日获深股通增持10.62万股
- 业绩好于预期,英特尔盘后大涨8%!英特尔CEO:人工智能推动个人电脑销量
- 中国大学列表
- 先声药业:自研大分子创新药SIM0278获批临床
- 平动系数要调到0.9以上吗(平动系数)
- 献礼“八一”!云南乐声合唱团唱响嘹亮军歌
- 刚刚公告,恒大汽车明起复牌!2年亏了840亿元,总负债超1800亿元
- 暑期档总票房破78亿!
- 十大汽车轮胎品牌排行榜一览
- 寒锐钴业拟推2023年限制性股票激励计划
- 安全在身边!夏季高温 电器使用时需注意防火
- 特别策划|堆堆搬家 八方来贺
- 南京公积金缴存基数2023年最新标准是多少?附缴存比例、缴费标准
- 和欣赏你的人在一起,你会更优秀
- 市直一般高中及中职学校录取分数线发布
