Az eddig ismert internetnek annyi?

Egy érdekes cikk jelent meg a Business Insideren, aminek az olvasása közben egyre inkább az az érzés fogott el: már nemcsak a digitális zaj nőtt meg brutálisan az utóbbi években, hanem magának az „internetes valóságnak” is mintha egyre kevesebb köze lenne a valódi emberi tudáshoz. Az AI-forradalom nemcsak új eszközöket adott a kezünkbe – hanem elkezdte átrajzolni az alapokat is.

A cikk központi állítása szerint a „tiszta internet” korszaka lezárult, és ez legalább annyira technológiai, mint társadalmi probléma. De mit is jelent ez pontosan? És miért kell ezzel nekünk, vállalkozóknak is foglalkoznunk?

AI-generált tartalom mindenhol – és ennek ára van

A ChatGPT 2022-es berobbanása óta az internetet elárasztotta a mesterséges intelligenciával gyártott tartalom. Blogposztok, hírek, termékleírások, SEO-szövegek, még kommentek is. A legtöbb felhasználó nem is tudja megkülönböztetni, hogy ember vagy gép írta – sőt, az AI-k sokszor már egymás tartalmait tanulják vissza, így elkezdik saját magukat másolni.

Ezt nevezik az AI-fejlesztők „modellkollapszusnak” – amikor a mesterséges intelligenciák már nem valódi emberi tudásból tanulnak, hanem egyre torzabb, generált tartalomhalmazból. Mintha egy fénymásolatot másolnánk újra és újra – minden egyes iterációval egyre kevésbé éles és valós. Ez ugye 2022 előtt, azért nem volt probléma, mert az internet még ember általi tartalmakkal volt tele, kutatásokkal, cikkekkel, adatokkal. Ez változott most meg, és ahogy az interneten az SEO optimalizált AI tartalmak generálják a forgalmat, úgy indul ez a fake-iteráció a tanuló modellekkel.

#FunFact A cikk hoz egy példát: Paul Graham, a Y Combinator alapítója nemrég arról beszélt, hogy pizzasütési tippeket keresett a Google-n, hogy hány fokon kell sütni a pizzát(?), de minden találat csak egy „AI-generált SEO-vacak” volt. A végén azon találta magát, hogy a dátumok alapján próbálta kiszűrni a valódi, ember által írt cikkeket (az AI előtti időkből).

De nem csak ő jár így. Én is írtam itt már arról, hogy sokszor inkább reddit bejegyzésekre keresek, hogy ott valódi válaszokból informálódjak, tapasztalatból. A keresőoptimalizálás és az AI-eszközök kombinációja teljesen „megmérgezte” a találati listákat – sokszor több oldalt is át kell “nyálazni”, mire valódi tartalmat találunk. Ami hasznos is.

Vírusmentes digitális régészet

Erre egyébként egy egészen elképesztő technológiai és történelmi párhuzam is felhúzható: a cikk a „low-background steel” fogalmát hozza be. Ez olyan acél, amit még az atombombák előtti korszakban gyártottak, és amit ma is használnak például Geiger-számlálók gyártásához, mert nem szennyezett radioaktivitással.

És hogy jön ez ide? Hát, talán már látjátok is kettő közötti párhuzamot: a szennyezettség előtti állapotok megőrzése és szükséglete… Nos, egyre több kutató kezdte el gyűjteni a 2022 előtti, ember által írt, „tiszta” internetes tartalmakat, hogy ezek legyenek az AI-k jövőbeli tanulási alapjai. Lényegében lementik a szennyezettség előtti internetes tartalmakat – kvázi digitális régészet. Olyan projektek indultak, mint a LowBackgroundSteel.ai, amely archiválja a régi fórumokat, open source kódokat, nyelvészeti adatbázisokat. Ez egyébként John Graham-Cumming, a Cloudflare volt CTO-jának kezdeményezése.

Pár példa az általuk mentett anyagokra:

GitHub Arctic Code Vault: 2020 februárjában lementették az egész nyílt forráskódú GitHub állományt, amit egy norvég szénbányába temettek el (komolyan!). Ez még azelőtt történt, hogy az AI elkezdett tömegével „programozni”.
Wordfreq projekt: Robyn Speer nyelvész online szóhasználatot mért és modellezett – amíg 2021 körül fel nem adta. 2024-ben így írt erről: „A generatív AI beszennyezte az adatokat.” Példát is hozott: a „delve” szó hirtelen gyakrabban kezdett megjelenni, mert a ChatGPT „szereti”. Miközben soha ennyiszer nem használták ezt az emberek valójában.

Fontos azért, hogy ne démonizáljuk a generatív AI-t. A probléma nem az, hogy létezik, hanem hogy ma már az internet tartalmainak óriási része gépi eredetű, és ezt a legtöbben nem is veszik észre. Ez torzítja a keresőmotorok találatait, nyelvi statisztikákat, sőt: újramodellezi azt, hogyan gondolkodunk. Innen jön a párhuzam a „low-background steel” koncepcióval – csak most nem sugárzásról van szó, hanem adat-eredet tisztaságról.

Back to the basics

A Cloudflare egyik alelnöke úgy fogalmazott: ha elveszítjük az emberi eredetű adatokat, akkor elveszítjük a közös valóságunkat is. Márpedig ez nemcsak az AI-modellek szempontjából fontos – hanem abból is, hogy hogyan látjuk, értjük, értelmezzük a világot.

A jövő nem arról szól, hogy „ember vagy gép” – hanem hogy hogyan tudjuk megőrizni a valódi gondolatokat, történeteket, nézőpontokat az AI által generált tartalomfolyamban

Ha te is használsz AI-eszközöket (például cikkíráshoz, termékleíráshoz, közösségi posztokhoz), érdemes tudatosan belevinni valódi tudást. Például:

írj bele saját sztorikat, példákat, amik csak nálad fordulhatnak elő;
egészítsd ki az AI által javasolt szöveget a saját szavaiddal, tapasztalataiddal;
tedd bele a céged valós adatait, statisztikáit;
ne hagyd, hogy minden tartalmad steril és felismerhetetlen legyen.

Ez nemcsak a márkád hitelességét őrzi meg, hanem segít abban is, hogy a saját anyagaid is értékes „low-background” tudásként maradjanak meg – még egy olyan korban is, amikor mindenki a ChatGPT-re bízza a szövegírást. Gondolj a Minner gyakorlatias anyagaira, a cégfejlesztési ötletekre, a sikeres cégek sorozatra – mindben benne van a mi tapasztalatunk, a kutatásaink, interjúink és közös munkák a cégekkel!

És mi van a keresőmotorokkal, SEO-val? A hagyományos keresőmotorok piaca átalakulóban van. Az AI megoldások (Google AI Overview, ami itthon is bevezetésre került már) egyre több felhasználót vonzanak, különösen azokat, akik gyors és pontos információkra vágynak. Az AI alapú keresőmotorok elterjedése azt eredményezi, hogy kevesebb forgalom jut a hagyományos weboldalakra. Ez egy új kihívás a SEO-val foglalkozó szakembereknek és tartalomkészítőknek, akiknek alkalmazkodniuk kell a változó körülményekhez. Érdekelnek a megváltozott játékszabályok? Olvasd el az erről szóló cikkünket: Google Search? AI! Felforgatják a keresőmotorok világát – a tiédet is!

Lényeg a lényeg, az AI képes gyorsítani a tartalomgyártást, segíthet megszüntetni az unalmas feladatokat – de csak akkor, ha valódi tudásra és tapasztalatra épít. Különben csak „önmagát eszi meg”.

Ne hagyd, hogy a branded „generált semmiség” legyen.
Ne csak másolatokat gyárts, hanem valós, emberi értéket adj,
és ha tudást építesz (pl. szakmai blog, oktatás, márkaépítés), akkor legyél benne TE is.

Olvasnál még a témában?

Forrás:
Business Insider, Minner

Fotó:
Envato License

MINNER

Az eddig ismert internetnek annyi?

AI-generált tartalom mindenhol – és ennek ára van

Vírusmentes digitális régészet

Back to the basics

Olvasnál még a témában?

Az immerzió nem büdzsékérdés. Élményeket adsz el, akkor is, ha nem...

Több kontroll a reklámok felett? Nagyobb elfogadási arány és több figyelem

Használt autó értékesítés: Ahol minden millió számít

7 lehetőség, amivel csökkentheted induló vállalkozói költségeidet

Kilőtt a KKV-k gazdasági bizalma

Alza manó győzött. eMag azért még a dobogón. E-kereskedelmi statisztikák

Új főnököd lett. Most te jössz. Mit csinálj az első hat...

Vagyonadó: mennyi jöhet belőle valójában?

Spekuláció helyett: terv, stratégia, adaptáció