neprihlásený Piatok, 19. apríla 2024, dnes má meniny Jela
Google použil umelú inteligenciu aj na zlepšenie čítania komiksov

Značky: Googleumelá inteligencia

DSL.sk, 22.7.2016


Spoločnosť Google, ktorá čoraz intenzívnejšie využíva metódy umelej inteligencie a strojového učenia, aktuálne využila takéto technológie na výrazné zlepšenia čítania komiksov na mobilných zariadeniach.

Komiksy sú typicky kreslené na stranách formátu až cca 18 cm x 27 cm a pri zobrazovaní na bežných mobilných zariadeniach, najmä smartfónoch ale aj menších tabletoch, sú tak texty v bublinách vzhľadom na ich malú veľkosť slabo čitateľné až nečitateľné.

Užívatelia ich bežne tak čítajú nepohodlne so zoomovaním a posúvaním sa po jednej stránke bez toho, aby videli celý obrázok.

Google teraz nasadil technológiu strojového učenia, ktorá v obrázkoch komiksov identifikuje jednotlivé bubliny s textom a užívateľovi ich postupne pri čítaní zväčšuje. Naraz je zväčšená jedna bublina, pričom posúvať sa na ďalšie je možné tlačidlom hlasitosti.


Bublina s textom identifikovaná a zväčšená novou technológiou Bubble Zoom, kliknite pre zväčšenie (obrázok: Google)



Technológia bola pod označením Bubble Zoom pridaná do aplikácie Google Play Books pre čítanie kníh na Androide. Google detaily použitej technológie nezverejnil, veľmi častou metódou strojového učenia používanou aj v Google sú ale neurónové siete. Oznámenie Google naznačuje ich použitie aj v tomto prípade, keď hovorí o natrénovaní systému na identifikáciu bublín. Či je identifikácia bublín následne realizovaná priamo v aplikácii alebo na serveroch spoločnosti Google neuvádza.


Ukážka fungovania Bubble Zoom (video: Google)



Technológia je zatiaľ funkčná pre anglické verzie komiksov od Marvelu a DC, do budúcnosti Google ale avizuje jej rozšírenie na ľubovoľné komiksy vrátane japonských komiksov manga.

Na čoraz intenzívnejšie využívanie umelej inteligencie spoločnosťou Google sme upozornili už v máji, keď spoločnosť jasne deklarovala ako dôležité technológie do budúcnosti technológie umelej inteligencie a strojového učenia. Google si dokonca na akceleráciu výpočtov vyvinul vlastný procesor pre umelú inteligenciu, Tensor Processing Unit, TPU.


      Zdieľaj na Twitteri



Najnovšie články:

Špehovacie satelity SpaceX už snímkujú Zem, s vyšším rozlíšením ako doterajšie
Linux si na PC drží podiel 4%
AI výkon tohtoročnej generácie Intel CPU bude vyšší ako 100 teraops/s
Apple bude mať nový seriál o alternatívnom sovietskom vesmírnom programe, predĺžila For All Mankind
Pôsobivého dvojnohého robota Atlas nahradí úplne nová elektrická verzia
O2 spustilo predaj na diaľku. Namiesto eID sa fotí tvár a občiansky, nedá sa objednať eSIM ani predplatenka
Klon populárnej databázy Redis od Linux Foundation k dispozícii v prvej verzii
Helikoptéra na Marse bude zbierať dáta aj po strate komunikácie so Zemou
Vývoj pôsobivého dvojnohého robota prekvapivo končí
Spustená výrobca QLC flash pamäte s viac ako 200 vrstvami


Diskusia:
                               
 

to vazne este niekto cita?
Ale ako technologicky pokus urcite dobre, vyznat sa v tom pisanom/kreslenom chaose...
Odpovedať Známka: -6.0 Hodnotiť:
 

Jasne. A to este niekto frfle stale?
Odpovedať Známka: 6.2 Hodnotiť:
 

Na to treba umelu inteligenciu??? Nemyslim si, ze je tazke nakodit algoritmus, ktory najde elipsu s ciernym okrajom, bielym pozadim a vnutri je nejaky text...
Odpovedať Známka: 5.0 Hodnotiť:
 

Jak som písal nižšie, nie vždy je to elipsa, nie vždy je to biele pozadie, nie vždy je to čierny hrubý okraj. Ale to všetko mimo, pozeral si to video? Podľa tej ukážky ten algoritmus aj sleduje poradie bublín v akom majú byť zobrazované. Nie je to len o tom nájsť tie dialógy, ale aj vyberať tie správne. Všeobecne by sa dal použiť algoritmus že prvý z hora zľava, ale nie vždy. Tiež je dobré spomenúť, že komix môže byť aj čiernobiely, a potom v spojení s ostatnými problémami je to zložité pre bežné algoritmy. NN sú rýchle a veľmi presné, dá sa to do určitej mieri spraviť aj bez NN, ale bude to zložitejšie, pomalšie a nepresnejšie, tak prečo?
Odpovedať Známka: 6.7 Hodnotiť:
 

budda budda budda
Odpovedať Známka: 10.0 Hodnotiť:
 

Komix v mobile, super nápad.
V pdf-ku sa dajú stiahnuť Gb komixov.

Škoda, že ten program na rozpoznávanie sa nedá stiahnuť a má ho iba google.
Odpovedať Známka: 10.0 Hodnotiť:
 

ano, bieli beta samci (a potom sa cuduju, ze preco biele samice idu po ciernych klobasach)
Odpovedať Známka: -3.3 Hodnotiť:
 

Ľudia si v diskusiách často ventilujú len osobné frustrácie. Nadávajú hlavne anonymne, pod vymyslenými menami si riešia svoje komplexy.
Odpovedať Známka: 10.0 Hodnotiť:
 

Na toto podla mna neuronky nie su treba. V komixoch, ktore poznam, su to jedine biele casti okrem rozdeleni obsahujuce nieco cierne (pismena). Naviac maju specificky tvar.

Algoritmus by som popisal jednoducho - postupuj z laveho horneho rohu po riadkoch, pokym nenajdes bielu farbu. Tento bod si zapamataj a pomocou upraveneho flood fillu najdi ohranicenie tejto oblasti - flood fill bude postupovat len tam, kde biely pixel susedi s pixelom inej farby (o trochu pokrocilejsie by bolo, ze je to susedstvo vo vzdialenosti viac pixelov). Ak je okraj na okraji obrazku, tak ho vyrad a celu oblast floodfillni na inu farbu, nech nezavadzia, lebo ide o oddelovac.
Ak nie je na okraji obrazku, tak oblast zvnutra floodfilluj ako pravdepodobnu bublinu, kde bude floodfill postupovat len po bielej a ciernej (prip. aj tmavosedej - kvoli antialiasingu komixov). Ak floodfill obsahuje vsetky vnutorne body, potom ide o bublinu a priprav jej zvacsovanie (hranice uz mame).

Odpovedať Známka: 2.5 Hodnotiť:
 


Casova narocnost - pri najhorsom pre kazdy pixel flood fill, ale raz spracovane oblasti by sme si mohli ukladat do disjoint setu, kde operacia amortizovane trva O(alfa(n)), kde alfa je inverzna Ackermannova funkcia.
Pri "s" susediacich pixeloch by sa lookup pouzival pri kazdom pristupe k tomu bodu, co znamena jeden pristup na prvotne prechadzanie a potom amortizovane O(s*alfa(n)) pristupov od susedov. Join by sa pouzival pri najdeni noveho nezaujimaveho pixela v ramci floodfillu, ale to sa stane vzdy najviac raz, to sa strati v konstante.
Pisem "zvnutra flood fillovat" - to pre ucely komixov staci zobrat priemer max a min suradnic bubliny, to sa zvlada v konstantom case.
Takze by som to cele zvladol v O(n*s*alfa(n)), co je pri konstantom s O(n*alfa(n)).
Priestorova narocnost - O(n) na ulozenie pola, disjoint set nebude vacsi ako O(n), takze O(n).
A teraz mi tu najdite chyby alebo naco je treba umela inteligencia.
Odpovedať Známka: 6.0 Hodnotiť:
 

No neviem, ja si myslím, že aj v bežných komixoch sa často vyskytuje biela farba v ohraničených oblastiach s textom bez toho aby to bola bublina s textom, ako nápisy, text na papieri, ceduľky a podobne. ďalšia vec je, že bublina s textom nie je vždy ohraničená ako "bublina" niekedy môže text len tak poletovať v priestore bez zmeny pozadia alebo ohraničenia (ale to skôr pre menej podstatné informácie) a posledne si myslím, že Google zvažuje to rozšíriť pre širšie spektrum komixov, napríklad aj pre mangu. Mangy sú skoro vždy úplne čiernobiele tak vizuálne rozpoznávanie tu určite porazí floodfill selekciu. Samozrejme ešte neviem ako na tieto príklady reaguje google a tvoj algoritmus by určite fungoval na *väčšinu* prípadov.
Odpovedať Známka: 0.0 Hodnotiť:
 

--> ešte by som dodal, že NN siete sú rýchle a pokiaľ nepoužili rekurzívne siete tak myslím že je komplexita len O(n) podľa počtu vrstiev a neurónov v každej. čo môže byť pomalšie ako floodfill pre malé oblasti, ale má to skvelú škálovateľnosť na veľké oblasti (npr. väčšie rozlíšenie alebo ako som spomínal, čiernobiele komixy).
čo myslíš ty?
Odpovedať Hodnotiť:
 

To znie vsetko pekne a realne, aj ked asi polovici z toho velmi nerozumiem. Ale treba brat do uvahy aj to ze znie lepsie ked povies "Mam umelu inteligenciu co mi cita komiksy", ako "Mam appku co mi cita komiksy". To potom nemas ten UltraHD 8K TurboAI pocit.
Odpovedať Známka: 1.4 Hodnotiť:
 

horsie by bolo, keby bol v komixe biely kamion... ten si ani tesla nevsimne
Odpovedať Známka: 6.5 Hodnotiť:
 

a potom sa najde niekto, kto bude chciet citat nejaku mangu. a system sa zblazni.

resp. mozes mat cierne pozadie a cervene pismo, ako to niekedy zaporaci vedia...
Odpovedať Známka: 5.0 Hodnotiť:

Pridať komentár