DSL.sk - Google použil umelú inteligenciu aj na zlepšenie čítania komiksov

neprihlásený

Streda, 22. júla 2026, dnes má meniny Magdaléna

Google použil umelú inteligenciu aj na zlepšenie čítania komiksov

Značky: Googleumelá inteligencia

DSL.sk, 22.7.2016

Spoločnosť Google, ktorá čoraz intenzívnejšie využíva metódy umelej inteligencie a strojového učenia, aktuálne využila takéto technológie na výrazné zlepšenia čítania komiksov na mobilných zariadeniach.

Komiksy sú typicky kreslené na stranách formátu až cca 18 cm x 27 cm a pri zobrazovaní na bežných mobilných zariadeniach, najmä smartfónoch ale aj menších tabletoch, sú tak texty v bublinách vzhľadom na ich malú veľkosť slabo čitateľné až nečitateľné.

Užívatelia ich bežne tak čítajú nepohodlne so zoomovaním a posúvaním sa po jednej stránke bez toho, aby videli celý obrázok.

Google teraz nasadil technológiu strojového učenia, ktorá v obrázkoch komiksov identifikuje jednotlivé bubliny s textom a užívateľovi ich postupne pri čítaní zväčšuje. Naraz je zväčšená jedna bublina, pričom posúvať sa na ďalšie je možné tlačidlom hlasitosti.

Bublina s textom identifikovaná a zväčšená novou technológiou Bubble Zoom, kliknite pre zväčšenie (obrázok: Google)

Technológia bola pod označením Bubble Zoom pridaná do aplikácie Google Play Books pre čítanie kníh na Androide. Google detaily použitej technológie nezverejnil, veľmi častou metódou strojového učenia používanou aj v Google sú ale neurónové siete. Oznámenie Google naznačuje ich použitie aj v tomto prípade, keď hovorí o natrénovaní systému na identifikáciu bublín. Či je identifikácia bublín následne realizovaná priamo v aplikácii alebo na serveroch spoločnosti Google neuvádza.

Ukážka fungovania Bubble Zoom (video: Google)

Technológia je zatiaľ funkčná pre anglické verzie komiksov od Marvelu a DC, do budúcnosti Google ale avizuje jej rozšírenie na ľubovoľné komiksy vrátane japonských komiksov manga.

Na čoraz intenzívnejšie využívanie umelej inteligencie spoločnosťou Google sme upozornili už v máji, keď spoločnosť jasne deklarovala ako dôležité technológie do budúcnosti technológie umelej inteligencie a strojového učenia. Google si dokonca na akceleráciu výpočtov vyvinul vlastný procesor pre umelú inteligenciu, Tensor Processing Unit, TPU.

Najnovšie články:

	Hackerský útok odstavil rumunský kataster nehnuteľností
	Apple zrejme čoskoro uvedie skladateľný iPhone, naznačuje už aj pripravovaný nový iOS
	Montáž štvrtého reaktoru Mochoviec bola dokončená, je hermeticky uzavretý
	Česká vláda schválila zákaz mobilov v školách a škôlkach
	Búrky spôsobili na Slovensku rozsiahle výpadky elektriny
	Slovensko.sk má opäť technické problémy
	Starlink opäť zmenil ponuku, zhoršuje programy Roam
	OpenPGP pridalo podporu algoritmov odolných kvantovým počítačom
	Číňania vyvinuli praktické solárne články s účinnosťou 35.5%
	Objavená prvá pevná planéta v obývateľnej zóne, ktorá má atmosféru

Diskusia:

to vazne
Od: bernardin sa premenil na ovcu | Pridané: 22.7.2016 10:41

to vazne este niekto cita?
Ale ako technologicky pokus urcite dobre, vyznat sa v tom pisanom/kreslenom chaose...

Odpovedať Známka: -6.0 Hodnotiť:

Re: to vazne
Od: Reikii | Pridané: 22.7.2016 10:53

Jasne. A to este niekto frfle stale?

Odpovedať Známka: 6.2 Hodnotiť:

Re: to vazne
Od: karolkooooo | Pridané: 22.7.2016 12:30

Na to treba umelu inteligenciu??? Nemyslim si, ze je tazke nakodit algoritmus, ktory najde elipsu s ciernym okrajom, bielym pozadim a vnutri je nejaky text...

Odpovedať Známka: 5.0 Hodnotiť:

Re: to vazne
Od: knjiCdo | Pridané: 22.7.2016 18:24

Jak som písal nižšie, nie vždy je to elipsa, nie vždy je to biele pozadie, nie vždy je to čierny hrubý okraj. Ale to všetko mimo, pozeral si to video? Podľa tej ukážky ten algoritmus aj sleduje poradie bublín v akom majú byť zobrazované. Nie je to len o tom nájsť tie dialógy, ale aj vyberať tie správne. Všeobecne by sa dal použiť algoritmus že prvý z hora zľava, ale nie vždy. Tiež je dobré spomenúť, že komix môže byť aj čiernobiely, a potom v spojení s ostatnými problémami je to zložité pre bežné algoritmy. NN sú rýchle a veľmi presné, dá sa to do určitej mieri spraviť aj bez NN, ale bude to zložitejšie, pomalšie a nepresnejšie, tak prečo?

Odpovedať Známka: 6.7 Hodnotiť:

Re: to vazne
Od: party | Pridané: 22.7.2016 12:43

budda budda budda

Odpovedať Známka: 10.0 Hodnotiť:

Re: to vazne
Od: wauuu | Pridané: 22.7.2016 17:56

Komix v mobile, super nápad.
V pdf-ku sa dajú stiahnuť Gb komixov.

Škoda, že ten program na rozpoznávanie sa nedá stiahnuť a má ho iba google.

Odpovedať Známka: 10.0 Hodnotiť:

Re: to vazne
Od: Baba Jaga bez riti | Pridané: 22.7.2016 14:45

ano, bieli beta samci (a potom sa cuduju, ze preco biele samice idu po ciernych klobasach)

Odpovedať Známka: -3.3 Hodnotiť:

Re: ..............
Od: .............. | Pridané: 22.7.2016 18:32

Ľudia si v diskusiách často ventilujú len osobné frustrácie. Nadávajú hlavne anonymne, pod vymyslenými menami si riešia svoje komplexy.

Odpovedať Známka: 10.0 Hodnotiť:

Nejde na to takyto jednoduchy algoritmus?
Od: aaaaaaaaaaaaaaa | Pridané: 22.7.2016 10:54

Na toto podla mna neuronky nie su treba. V komixoch, ktore poznam, su to jedine biele casti okrem rozdeleni obsahujuce nieco cierne (pismena). Naviac maju specificky tvar.

Algoritmus by som popisal jednoducho - postupuj z laveho horneho rohu po riadkoch, pokym nenajdes bielu farbu. Tento bod si zapamataj a pomocou upraveneho flood fillu najdi ohranicenie tejto oblasti - flood fill bude postupovat len tam, kde biely pixel susedi s pixelom inej farby (o trochu pokrocilejsie by bolo, ze je to susedstvo vo vzdialenosti viac pixelov). Ak je okraj na okraji obrazku, tak ho vyrad a celu oblast floodfillni na inu farbu, nech nezavadzia, lebo ide o oddelovac.
Ak nie je na okraji obrazku, tak oblast zvnutra floodfilluj ako pravdepodobnu bublinu, kde bude floodfill postupovat len po bielej a ciernej (prip. aj tmavosedej - kvoli antialiasingu komixov). Ak floodfill obsahuje vsetky vnutorne body, potom ide o bublinu a priprav jej zvacsovanie (hranice uz mame).

Odpovedať Známka: 2.5 Hodnotiť:

Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: aaaaaaaaaaaaaaaaaaaa | Pridané: 22.7.2016 10:55

Casova narocnost - pri najhorsom pre kazdy pixel flood fill, ale raz spracovane oblasti by sme si mohli ukladat do disjoint setu, kde operacia amortizovane trva O(alfa(n)), kde alfa je inverzna Ackermannova funkcia.
Pri "s" susediacich pixeloch by sa lookup pouzival pri kazdom pristupe k tomu bodu, co znamena jeden pristup na prvotne prechadzanie a potom amortizovane O(s*alfa(n)) pristupov od susedov. Join by sa pouzival pri najdeni noveho nezaujimaveho pixela v ramci floodfillu, ale to sa stane vzdy najviac raz, to sa strati v konstante.
Pisem "zvnutra flood fillovat" - to pre ucely komixov staci zobrat priemer max a min suradnic bubliny, to sa zvlada v konstantom case.
Takze by som to cele zvladol v O(n*s*alfa(n)), co je pri konstantom s O(n*alfa(n)).
Priestorova narocnost - O(n) na ulozenie pola, disjoint set nebude vacsi ako O(n), takze O(n).
A teraz mi tu najdite chyby alebo naco je treba umela inteligencia.

Odpovedať Známka: 6.0 Hodnotiť:

Re: Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: knjiCdo | Pridané: 22.7.2016 11:50

No neviem, ja si myslím, že aj v bežných komixoch sa často vyskytuje biela farba v ohraničených oblastiach s textom bez toho aby to bola bublina s textom, ako nápisy, text na papieri, ceduľky a podobne. ďalšia vec je, že bublina s textom nie je vždy ohraničená ako "bublina" niekedy môže text len tak poletovať v priestore bez zmeny pozadia alebo ohraničenia (ale to skôr pre menej podstatné informácie) a posledne si myslím, že Google zvažuje to rozšíriť pre širšie spektrum komixov, napríklad aj pre mangu. Mangy sú skoro vždy úplne čiernobiele tak vizuálne rozpoznávanie tu určite porazí floodfill selekciu. Samozrejme ešte neviem ako na tieto príklady reaguje google a tvoj algoritmus by určite fungoval na *väčšinu* prípadov.

Odpovedať Známka: 0.0 Hodnotiť:

Re: Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: knjiCdo | Pridané: 22.7.2016 11:54

--> ešte by som dodal, že NN siete sú rýchle a pokiaľ nepoužili rekurzívne siete tak myslím že je komplexita len O(n) podľa počtu vrstiev a neurónov v každej. čo môže byť pomalšie ako floodfill pre malé oblasti, ale má to skvelú škálovateľnosť na veľké oblasti (npr. väčšie rozlíšenie alebo ako som spomínal, čiernobiele komixy).
čo myslíš ty?

Odpovedať Hodnotiť:

Re: Pokracovanie: Nejde na to takyto jednoduchy algoritmus?
Od: Jojojoj | Pridané: 22.7.2016 11:51

To znie vsetko pekne a realne, aj ked asi polovici z toho velmi nerozumiem. Ale treba brat do uvahy aj to ze znie lepsie ked povies "Mam umelu inteligenciu co mi cita komiksy", ako "Mam appku co mi cita komiksy". To potom nemas ten UltraHD 8K TurboAI pocit.

Odpovedať Známka: 1.4 Hodnotiť:

Re: Nejde na to takyto jednoduchy algoritmus?
Od reg.: deja_vu | Pridané: 22.7.2016 11:09

horsie by bolo, keby bol v komixe biely kamion... ten si ani tesla nevsimne

Odpovedať Známka: 6.5 Hodnotiť:

Re: Nejde na to takyto jednoduchy algoritmus?
Od: >.> | Pridané: 22.7.2016 11:47

a potom sa najde niekto, kto bude chciet citat nejaku mangu. a system sa zblazni.

resp. mozes mat cierne pozadie a cervene pismo, ako to niekedy zaporaci vedia...

Odpovedať Známka: 5.0 Hodnotiť:

Pridať komentár