绿茶通用站群绿茶通用站群

i

i 免费数据薅不到了!又有网站向AI公司开口要钱 马斯克已作出“价格示范”

  继“美版贴吧”Reddit宣(xuān)布向AI公司收取数据使用(yòng)费(fèi)之后(hòu),又有一(yī)家网站计划跟进。

  IT问(wèn)答网(wǎng)站Stack Overflow日前宣(xuān)布,计划从今年年中起(qǐ),向大型AI开发商收(shōu)取数据访(fǎng)问费(fèi)用,付费(fèi)后才可(kě)以(yǐ)获取该平(píng)台(tái)上(shàng)的(de)5000万(wàn)个问题(tí)与答案(àn)。

  Stack Overflow是一(yī)个程序设计领域的(de)问答网(wǎng)站,隶属Stack Exchange Network。网站上最常(cháng)见的问答主(zhǔ)题包(bāo)括(kuò)JavaScript、Java、C#、PHP、Android、Python、jQuery和(hé)HTML等。如今其注册用户已超过2000万(wàn)。

  其首席执行官Prashanth Chandrasekar表示,“社区(qū)平台推(tuī)动(dòng)了大语言(yán)模型(LLM)发展,所(suǒ)作(zuò)出(chū)的贡献也必须得到补偿(cháng)。”

  同样也是在本周,美国新闻媒体联盟(The News/Media Alliance,前美国(guó)报业协会(huì))公布多项原(yuán)则,呼吁(xū)AIGC开发公司就数据使用展开谈判,并要求(qiú)这(zhè)些开发公司(sī)尊重新闻媒体获得公平(píng)补偿的权利。

  环球音乐集团(tuán)(Universal Music Group)近(jìn)日也(yě)发出警告(gào),阻止(zhǐ)AI服务(wù)从(cóng)其受(shòu)版权(quán)保(bǎo)护的歌曲中抓取旋律和歌词。

i  ▌科技巨头(tóu)或成主要收费对象 马斯克(kè)已作出“价格示范”

  实际上(shàng),OpenAI、谷(gǔ)歌、Meta等多家科技公(gōng)司在建立(lì)大(dà)规模AI项目时,历来不会为大部分训练数据(jù)付费(fèi),而是选择从(cóng)网络直接(jiē)“搜刮”,数据来源便囊(náng)括上文(wén)提到的Stack Overflow和Reddit。当(dāng)然,在美国此举(jǔ)通常(cháng)被看作合法(fǎ)行为(wèi),但(dàn)仍存(cún)在一(yī)些版权与网站条款争议。

  但即便在这种情况下,ChatGPT等(děng)一(yī)系列AI大模型/聊(liáo)天机器(qì)人(rén)的(de)开(kāi)发费(fèi)用也已高(gāo)达数亿美(měi)元。随着(zhe)Reddit、Stack Overflow等网站开始“开口要钱”,这些(xiē)科技巨头的AI开发费用未来很可能“再(zài)上一层(céng)楼(lóu)”,而(ér)技术开发时间(jiān)或也将进(jìn)一步延长。

  至(zhì)于具(jù)体如何收费?不论是Stack Overflow还是Reddit都暂(zàn)未发布价格信息。

  Reddit透露(lù),“我们(men)正(zhèng)在处理(lǐ)这(zhè)个(gè)问题,将在未来几周(zhōu)内与合作伙伴分享(xiǎng)更多信息。”Stack Overflow则表示,公(gōng)司将借鉴(jiàn)研究Reddit的(de)策略,并与潜在客户(hù)展开协商,目前(qián)已与(yǔ)部分客户就数据(ijù)访问进(jìn)行(xíng)接触。

  这两家公司的收费(fèi)方案或许都将针对大型科技(jì)公司:Stack Overflow称(chēng)希望收费对象仅限于(yú)以商用(yòng)为目的开发(fā)LLM的大(dà)型公司(sī);Reddit也有类似表态。而其余(yú)用户与(yǔ)公司则有望(wàng)i继续免费使用(yòng)数据。

  而马斯克或许也为这(zhè)两家公司提供可供借(jiè)鉴的定(dìng)价(jià)方案——本月马斯克(kè)已提(tí)高推(tuī)特数(shù)据访问价格,起价为(wèi)每月4.2万(wàn)美元,可访问5000万条(tiáo)推文。而就(jiù)在本周三,马斯克(kè)刚(gāng)刚指控微软非法(fǎ)使用推特数据来(lái)训练(liàn)其AI模(mó)型,还(hái)直言“诉讼时(shí)间到”,警(jǐng)告(gào)要(yào)起诉微软。

未经允许不得转载:绿茶通用站群 i

评论

5+2=