绿茶通用站群绿茶通用站群

见字如晤,展信舒颜,展信安的用法

见字如晤,展信舒颜,展信安的用法 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆(bào)以来,微(wēi)软(ruǎn)公司创始人比(bǐ)尔·盖茨(cí)已(yǐ)多次公开谈论人工智(zhì)能话题。在(zài)最近的(de)一次采访中,他(tā)再次表示:“AI可能(néng)会让科技行(xíng)业迎来一次(cì)剧烈的洗牌(pái)”。

这个结论是他(tā)在(zài)当地时间2月(yuè)20日(rì)接受《In Good Company》节(jié)目专访(fǎng)时(shí)提出的(de)。

他预期(qī),AI的发展(zhǎn)可(kě)能会威胁到(dào)谷歌的市占率,因(yīn)为微软(ruǎn)在AI方面(miàn)的行动(dòng)相当迅速。而最终科技巨头将把AI整(zhěng)合成用户(hù)的“全(quán)能助(zhù)手”,包揽一切应用(yòng),与人们进行沟通并提供建议,可以取代亚马(mǎ)逊、Siri或(huò)Outlook等应用。

大佬口中(zhōng)全能助手的(de)到来可能尚(shàng)需时日,但(dàn)由ControlNet引发的又一次(cì)AI绘画浪潮,让AIGC在ChatGPT的(de)话题热点包围(wéi)中杀出重围(wéi)。

ChatGPT之后又(yòu)一应用(yòng)杀(shā)疯了,AIGC或进入可控(kòng)期(qī),将洗牌科技行(xíng)业?_黑料正(zhèng)能量

01

ControlNet颠覆AI绘画(huà)新玩法

AIGC向可(kě)控(kòng)靠近

以AI绘画为代表(biǎo)的AIGC上一次(cì)爆火(huǒ)的时候(hòu),还(hái)是(shì)2022年8月,在(zài)美国科罗拉(lā)多(duō)州举办的(de)新兴数字(zì)艺(yì)术家(jiā)竞赛中,一(yī)幅名为《太空歌剧院》的作品获奖。

随后各(gè)大厂(chǎng)商的AI绘画软件(jiàn)被广(guǎng)大网(wǎng)友熟知(zhī)并(bìng)体验,Stable Diffusion便是(shì)其中代(dài)表。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技(jì)行业?_黑料(liào)正能量(liàng)

用(yòng)户们可以(yǐ)在应用(yòng)中(zhōng)输入一组关键词或者一张(zhāng)照片(piàn),就(jiù)能(néng)获得(dé)一幅(fú)AI创作的(de)画作。

作画(huà)的关键(jiàn)就是所输入的文(wén)本。同(tóng)一组(zǔ)关键词也(yě)可以创作出很多张风格(gé)不(bù)一样(yàng)的(de)画作(zuò),这让创作的过程就像开盲盒(hé)。

很多用户很喜欢这种不确定的惊喜(xǐ),他们会将生成的美图(tú)当做头像(xiàng)。而另(lìng)一(yī)部分(fēn)喜欢翻看AI绘画(huà)的(de)“翻(fān)车”作品。在社交(jiāo)媒(méi)体上,许多用户分享AI“翻车现场(chǎng)”,例如,一位网友(yǒu)的小狗照片被(bèi)AI画成了(le)“肌(jī)肉男”,还有网友的个(gè)人照片被AI识别成了建筑。

而如(rú)今随着ControlNet的出现与加持,以往AI绘画的(de)填写关(guān)键词游戏可能要被颠覆(fù)了。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科(kē)技行业(yè)?_黑料正能量

ControlNet是一位正在(zài)斯坦福读博的中(zhōng)国(guó)人(rén)张吕敏创作的(de)一(yī)种(zhǒng)基(jī)于控制(zhì)点的图像变形(xíng)算法,主要用于数字(zì)图像处理(lǐ)、计算机(jī)视觉(jué)和计算机(jī)图形学等(děng)领域。

其SD插(chā)件一(yī)经发布,在短(duǎn)短的两天内便成为了AI绘画领域最新的热点。

在此之前,大家用了很多方(fāng)法想让AI生(shēng)成的结果尽可(kě)能的符合(hé)要求,但是都不尽(jǐn)如人(rén)意,它(tā)的出(chū)现(xiàn)代表着AI生成开始进(jìn)入真正的可控时期(qī)。

因(yīn)为ControlNet可以直接提(tí)取画面的构图,人物的姿势和(hé)画面的深度信(xìn)息等。有了它的帮助,就不用频繁的用提示词来(lái)碰运(yùn)气,抽(chōu)盲盒式的(de)创作了。

通俗的说ControlNet相当于(yú)给AI绘画(huà)加(jiā)了“魔法(fǎ)”,不少博主的作(zuò)品已经(jīng)获得了大量的浏览量,“viggo”就是(shì)其(qí)中之一,他用(yòng)朋友的照片(piàn)直接带她们(men)走进动漫(màn)世(shì)界(jiè)。

ChatGPT之后又(yòu)一应用(yòng)杀疯了(le),AIGC或进入可控期(qī),将洗(xǐ)牌科技行业?_黑料(liào)正能量

viggo先(xiān)用(yòng)StableDiffusion图片转(zhuǎn)文字。

再(zài)用Text2Prompt插件拓展(zhǎn)找到对应的关键词;最后用ControlNet插件绑定(dìng)骨骼开(kāi)始换关键(jiàn)词试效果。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入(rù)可控期(qī),将洗(xǐ)牌科技行业?_黑料正能量(liàng)

通过图片就可以(yǐ)看出来,效果十分惊艳。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能量

ChatGPT之后(hòu)又一应(yīng)用杀(shā)疯了(le),AIGC或(huò)进(jìn)入可控期(qī),将洗牌科技行业?_黑料正能量

更厉害的是,除了真实的照片,草图也可以加(jiā)上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍(shào)到ControlNet还能实现线稿转全(quán)彩图(tú)。大神张(zhāng)吕敏其本(běn)尊也亲自回应。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技行业(yè)?_黑(hēi)料正(zhèng)能量

不得不说(shuō)当(dāng)下AIGC已经(jīng)变得(dé)越来(lái)越强(qiáng)大,甚至输(shū)出的作品都已经能以(yǐ)假(jiǎ)乱(luàn)真了。

02

难辨虚实(shí),AIGC技术力爆(bào)发

警惕安(ān)全问(wèn)题

近日,“苏(sū)州金鸡湖有(yǒu)游艇party”的消息火遍(biàn)网络(luò),而经过警方辟谣这所谓的“party”可(kě)能是全(quán)国第(dì)一起AI绘图诈骗。

由(yóu)于这个活动里面(miàn)给出的美女照片都是AI制作的真人照片(piàn)绘图,因为太逼真,被大家当成(chéng)真事(shì)传播了

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或(huò)进入可(kě)控期,将洗牌科技行业?_黑料(liào)正(zhèng)能量(liàng)

不过仔细(xì)观察可以发现,活动发起者提(tí)供的(de)照片中有个很大的漏洞可以发现并非真人(rén),而是AI绘(huì)图,那便是图片中女性的手指部分(fēn)有的存(cún)在(zài)异(yì)常(cháng)。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将洗(xǐ)牌科(kē)技行业?_黑料正能(néng)量

有行业(yè)人事表示:“现在因为手指部(bù)分的绘画(huà)算法(fǎ)比(bǐ)较复(fù)杂,AI还不太(tài)会画人(rén)的手,但最(zuì)新看到的图(tú)片(piàn)已经(jīng)有越来越完美的AI模型出现,以后可(kě)能就完全没有漏洞了。

类似的AI作图诈骗在国(guó)外也已有发生。据英(yīng)国广播公司报道,土耳其地(dì)震期间,有(yǒu)Tiktok用户使用AI合成了儿童(tóng)受灾的假(jiǎ)照片发(fā)布到网络,以(yǐ)此诱(yòu)骗善良(liáng)的(de)人打赏(shǎng)“捐助”从而实施诈骗。

目前随着(zhe)技术发展,AIGC已经能(néng)做出真人(rén)照(zhào)片般(bān)的绘图效果,如果这样的图片被用(yòng)来诈骗,将(jiāng)非常(cháng)可怕。

此外AIGC还引发(fā)了很多担忧,一方面(miàn),批判者认为AI在“学(xué)习”了大量(liàng)前(qián)人的作(zuò)品之后,其创作没有任何情(qíng)绪和灵魂,难(nán)以和(hé)人类的艺术创作相提并论(lùn)。

另一方面,AIGC背后的版(bǎn)权、目前(qián)都并没有得到(dào)有效的解决,还(hái)有AIGC会不会代(dài)替人类“至(zhì)高无上(shàng)”的创(chuàng)意。

马斯克也(yě)强调,人工智能的安全(quán)问(wèn)题需(xū)要得(dé)到重视,太(tài)晚就来不及了。

03

AIGC下一站除了视频,还有远(yuǎn)方

技术(shù)都是有两(liǎng)面性的,潜在的危(wēi)害并不(bù)能掩盖(gài)其光(guāng)辉的贡献。现在看来,人工智(zhì)能技(jì)术(shù)将是(shì)第四次工业革(gé)命的核心驱动力量,将创造新的增(zēng)长(zhǎng)奇迹。

过去(qù)一年(nián),人工智能在(zài)技术(shù)和商业层面都有了(le)巨大进展,AI绘画就是(shì)人工智(zhì)能技术发生方向性(xìng)改变的一(yī)个代表。其下一站或许(xǔ)就(jiù)是视频。

此前(qián),Meta和谷歌先后发布了(le)几(jǐ)条引爆科(kē)技圈的短视频(pín)。这些视(shì)频(pín)引发关(guān)注并非(fēi)内容做(zuò)得多优秀,反而都非(fēi)常简单,比(bǐ)如(rú)一匹正(zhèng)在喝水的(de)马,一只(zhǐ)画(huà)画的玩具熊,或(huò)者(zhě)一段(duàn)骑摩托车的第一视(shì)角录像,随(suí)便一个有手机的人都可以随手(shǒu)录下一(yī)段。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

但(dàn)这些短(duǎn)视频的创作方式非常简单,创作见字如晤,展信舒颜,展信安的用法者(zhě)仅(jǐn)仅需要(yào)向AI输入一段话(huà),甚至只(zhǐ)是说一下(xià)要(yào)求,AI就可以根据需要生成一段(duàn)视频(pín)。

谷歌发布的两个(gè)AI生成视频分别(bié)来自于Imagen Video和(hé)Phenaki,前(qián)者主要(yào)突出的是高(gāo)清,与(yǔ)Meta的Make-A-Video没有太多(duō)的差别。

在(zài)Make-A-Video公布了(le)AI生成的(de)视频后,AI圈就已经玩了一波梗,一个能够做(zuò)出更高清视频的AI还(hái)不足以在短(duǎn)时间内(nèi)戳(chuō)中兴奋(fèn)点。

Phenaki更加令人(rén)震惊的(de)地方在(zài)于,它可以制作(zuò)出超过(guò)2分(fēn)钟(zhōng)的连贯的(de)也有确切内容的视(shì)频,这才是(shì)真正(zhèng)让人(rén)们感到惊喜的地(dì)方。因为无论AI生成的视频(pín)多么高(gāo)清(qīng),也只能是(shì)为内容生(shēng)产(chǎn)者提供一个灵感,一个(gè)素材,一个过场动(dòng)画(huà)。

不过能够制作出有具体剧情内容的视频就意味着(zhe),一些视频(pín)创作由AI代替人(rén)工完成已经初步有了(le)可能。

当(dāng)下(xià)AI的发展速度已(yǐ)经超过大部分人的(de)想象(xiàng)。内容产业的本质是供(gōng)给创(chuàng)造(zào)需求,AIGC作为全新的内容生产方(fāng)式(shì),可以为内容(róng)产业带来更(gèng)新(xīn)的(de)内(nèi)容(róng)风(fēng)格、更(gèng)快的生产速度,更(gèng)低的生产成本,这无疑会驱动内容产业的大(dà)爆发。

除了AI绘图、视频,AIGC技术(shù)还能(néng)应用(yòng)于音(yīn)乐、代码、机器人动作等(děng)多(duō)种内(nèi)容形(xíng)式的生成。不难发现该项技(jì)术不仅(jǐn)在游戏等行(xíng)业能得(dé)到有效(xiào)应用,对于下(xià)一(yī)代互联网(wǎng)各种元素的构(gòu)建亦有关键(jiàn)意义。

从商(shāng)业化(huà)的(de)角度来看,文(wén)化娱乐、教育、传媒等(děng)诸多领域,本身就对基于AI的可视化内容有强烈需求。

因此,AI绘画及视(shì)频或不是结果,而(ér)只是AI进程中的一块(kuài)重要(yào)拼图,有望在技术更新(xīn)的加持下(xià)实现更大(dà)的应用价值。

AI从理(lǐ)解内容,走向了(le)可(kě)以生成内容,甚至能够创造出独立(lì)价值和(hé)独立(lì)视(shì)角的内容(róng)。AIGC的(de)再次出圈,更代表(biǎo)着(zhe)未来的(de)先进生产力即将到(dào)来。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技(jì)行(xíng)业?_黑料正(zhèng)能量(liàng)

04

紧(jǐn)抓大模型与算力,牢(láo)固AIGC底座

从技术的发展也(yě)可以看出,在语言大(dà)模型(xíng)、图像(xiàng)大模型(xíng)之(zhī)后(hòu),多模(mó)态大(dà)模型已经成为了(le)新的(de)趋势。

大模型被誉为当(dāng)前人(rén)工智能(néng)发(fā)展的智(zhì)能底座,是全球竞争最(zuì)激(jī)烈的研(yán)究方向之一,包括谷歌、亚马逊、百度、阿里、腾讯(xùn)等众(zhòng)多头部企业都在(zài)竞相发力(lì)。

不过训见字如晤,展信舒颜,展信安的用法练大模型的确价格不菲,以国盛(shèng)证券发布的(de)《ChatGPT需要多少算力》报告估算(suàn),GPT-3训(xùn)练一次的(de)成本约为140万美元。而对于(yú)一些更大的(de)LLM(大型语言模(mó)型),训练成本则(zé)介于(yú)200万美元至1200万美元高价之间。

以ChatGPT在2023年1月(yuè)的(de)独(dú)立访客平均数1300万(wàn)计(jì)算,其对应芯片需求(qiú)为3万多片英伟达A100 GPU,初始投(tóu)入(rù)成本约为8亿美(měi)元,每日仅(jǐn)电(diàn)费就在(zài)5万美(měi)元左右。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行(xíng)业?_黑料正能量

此外不论(lùn)是ChatGPT还是AIGC,都(dōu)离不(bù)开庞大算力(lì)支持(chí)。在(zài)关注各类大模型(xíng)的发展同时,更(gèng)应(yīng)该关注算力网络的建设。

算力网络正驱(qū)动(dòng)AI产业发(fā)展进入史诗级加(jiā)速(sù)进程,让AIGC及通用AI这一(yī)人工(gōng)智能发展的终极目标(biāo)离得更近。

因为算(suàn)力可以对(duì)突破性技术创新提供大力的支(zhī)持。这方面,多模态大模(mó)型是典型。作(zuò)为面向未来强(qiáng)人工智(zhì)能、通(tōng)用人工(gōng)智能的重要技术创新,多模态(tài)大模型已经在人工智(zhì)能领域(yù)提出了很多年,业(yè)界(jiè)也有(yǒu)不少技术突破(pò),但是,多模态大(dà)模型进一步往下(xià)走(zǒu),算力需求呈几何式上升,一般(bān)的(de)算(suàn)力基础(chǔ)设施很快将难以胜任。

从图(tú)像、文(wén)字、语音单独一项的训练,到双模态、三模(mó)态的跃迁,让人(rén)工智能可(kě)以(yǐ)灵活(huó)应(yīng)对不同模态(tài)的转化、像人与世界(jiè)交互一样自然,这方面,由算力(lì)网(wǎng)络来驱(qū)动将有明(míng)显优势。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌科技(jì)行业(yè)?_黑料正能量

此外,还有很多(duō)需(xū)要(yào)爆发式增长的算力来支撑的技(jì)术创(chuàng)新,将在人工智能算力网络支撑(chēng)下(xià)快速推进。

AIGC已经露出曙光(guāng),期(qī)待(dài)在大模型和大算力的支(zhī)持下AIGC能(néng)持续(xù)颠覆内容(róng)生产(chǎn)的方式,将创(chuàng)造(zào)的边际成本(běn)降(jiàng)低,让万众受益。

未经允许不得转载:绿茶通用站群 见字如晤,展信舒颜,展信安的用法

评论

5+2=