17. března 2025
Doba, kdy jsme ručně přepisovali texty z fotek a obrázků se zdá býti za námi. Minimálně nový hráč v podobě Ai umělé inteligence do segmentu přepisů textů a OCR programů (programy na dolování textů z obrázků) slušně háže vidle.
Firmy po celém světě neustále vyvíjejí a zdokonalují své modely a není tedy divu, že umí vytahovat texty z obrázků. OCR programy se stávají nadbytečnými a ruční přepisy se nám také velmi rychle vzdalují.
Osobně používám na přepisy ChatGPT. U něj se mi ještě nestalo, že by něco nepřepsal (tím netvrdím, že by se to nemohlo stát). Zatím to šlape mega dobře a je to perfektní úspora času. Ovšem co je důležité, určitě si přepisovaný text ještě překontrolujte. Občas se mi stává, že mi to nepřepíše 1:1. Někdy mi opraví slangové výrazy, někdy se vyskytne drobná chybka. Níže v textu se můžete podívat na ukázku Ai čtení textů z obrázku. Pro ukázku jsem použil služby ChatGPT, Google Gemini a Perplexity.
Celkově jen mohu chválit (až na zaváhání Google Gemini). Ai opravdu usnadňuje práci v kanclu, ulehčuje práci grafika a šetří váš čas.
PS. Nezpomeňte, kontrola je důležitá :D
OCR znamená Optical Character Recognition (Optické rozpoznávání znaků). Je to technologie, která umožňuje převod tištěného nebo ručně psaného textu z obrázků, skenů nebo fotografií do digitální podoby, aby bylo možné s textem dále pracovat (kopírovat, upravovat, vyhledávat atd.).
Nejdříve se podívejte na zdrojový obrázek, ze kterého jsem nechal Ai vytěžit text:
Obrázek, scan, dokument nahrajete do umělé inteligenci (můžete použít i výše přiložený obrázek). Když máte zdrojový soubor nahraný, stačí zadat umělé inteligenci tento jednoduchý požadavek (prompt): Můžeš mi přepsat text z obrázku? Umělá inteligence by vám nyní měla začít vypisovat text z vašeho souboru.
Text vloženy bez úpravy:
Let Helsinky–Toronto byl naložen 400 cestujícími a pouhých 200 obědů. Letecká společnost udělala chybu a posádka byla v těžké situaci! Jedna chytrá letuška však přišla s nápadem! Asi 30 minut po letu nervózně oznámila:
„Dámy a pánové, nevím, jak se to stalo, ale máme na palubě 400 pasažérů a jen 200 obědů! Každý, kdo je tak laskavý a vzdá se jídla pro někoho jiného, dostane neomezené množství alkoholu zdarma po celou dobu letu!"
Její další oznámení bylo učiněno o 6 hodin později: „Dámy a pánové, pokud by si to někdo chtěl rozmyslet, máme ještě 200 volných obědů!"
Poučení z příběhu: alkoholici mají velmi laskavá srdce!
Google opět zazářil. Vložil jsem zadání a sledoval vygenerovaný text. K mému údivu Google Gemini nejdříve začal přepisovat text, ale cca po 4 slovech to smazal a vyhodil chybu: Nemůžu vám pomoct. Jsem pouze jazykový model a nedokážu to zpracovat a pochopit. Nevzdal jsem to s Gemini a přepnul na model: 2.0 Flash Thinking. Tento model už to přepsal viz neupravený text:
Let Helsinky-Toronto byl naložen 400 cestujícími a pouhých 200 obědů. Letecká společnost udělala chybu a posádka byla v těžké situaci! Jedna chytrá letuška však přišla s nápadem! Asi 30 minut po letu nervózně oznámila:
„Dámy a pánové, nevím, jak se to stalo, ale máme na palubě 400 pasažérů a jen 200 obědů! „Každý, kdo je tak laskavý a vzdá se jídla pro někoho jiného, dostane neomezené množství alkoholu zdarma po celou dobu letu! "
Její další oznámení bylo učiněno o 6 hodin později: „Dámy a pánové, pokud by si to někdo chtěl rozmyslet, máme ještě 200 volných obědů! "
Poučení z příběhu: alkoholici mají velmi laskavá srdce!
Text vloženy bez úpravy:
Let Helsinky–Toronto byl naložen 400 cestujícími a pouhých 200 obědů. Letecká společnost udělala chybu a posádka byla v těžké situaci! Jedna chytrá letuška však přišla s nápadem! Asi 30 minut po letu nervózně oznámila:
„Dámy a pánové, nevím, jak se to stalo, ale máme na palubě 400 pasažérů a jen 200 obědů! Každý, kdo je tak laskavý a vzdá se jídla pro někoho jiného, dostane neomezené množství alkoholu zdarma po celou dobu letu!"
Její další oznámení bylo učiněno o 6 hodin později: „Dámy a pánové, pokud by si to někdo chtěl rozmyslet, máme ještě 200 volných obědů!"
Poučení z příběhu: alkoholici mají velmi laskavá srdce!