Блогдун бардык окурмандарына салам!
Көбүнчө компьютерде иштегендер (ойнобойм, тактап айтканда, иштебейм) текстти таануу менен алектенишет деп ойлойм. Мисалы, сиз китептен үзүндүнү сканерлеп, эми бул бөлүктү документиңизге кыстарышыңыз керек. Сканерленген документ - бул сүрөт, бизге текст керек - бул үчүн сүрөттөрдөн текстти таануу үчүн атайын программалар жана онлайн кызматтары керек.
Таануу программалары жөнүндө мен буга чейинки посттордо жазганмын:
- текстти сканерлөө жана FineReader'де таануу (акы төлөнүүчү программа);
- FineReader аналогунда иштөө - CuneiForm (акысыз программа).
Ушул эле макалада, текстти таануу боюнча онлайн кызматтарына токтолгум келет. Акыр-аягы, эгерде сиз 1-2 сүрөт менен текстти тез арада алсаңыз, анда ар кандай программаларды орнотуудан убара болбойсуз ...
Маанилүү! Таануу сапаты (каталардын саны, окулушу ж.б.) сүрөттүн баштапкы сапатына көз каранды. Ошондуктан, сканерлөөдө (сүрөт тартуу ж.б.), сапатын мүмкүн болушунча жогору тандаңыз. Көпчүлүк учурда, 300-400 точ / дюйм сапаты жетиштүү болот (dpi - сүрөттүн сапатын мүнөздөөчү параметр. Дээрлик бардык сканерлердин орнотууларында бул параметр көрсөтүлөт).
Онлайн Кызматтар
Кызматтардын кандайча иштешин көрсөтүү үчүн, мен макалаларымдын биринин скриншотун алдым. Бул скриншот бардык кызматтарга жүктөлөт, алардын сүрөттөмөсү төмөндө келтирилген.
1) //www.ocrconvert.com/
Мага бул кызмат жөнөкөй болгондуктан аябай жагат. Сайт англис тилинде болсо дагы, орус тилинде жакшы иштейт. Каттоонун кажети жок. Таанууну баштоо үчүн, сиз 3 аракет кылышыңыз керек:
- сүрөтүңүздү жүктөп бериңиз;
- сүрөттөгү тексттин тилин тандаңыз;
- таанууну баштоо баскычын басыңыз.
Форматтарды колдоо: PDF, GIF, BMP, JPEG.
Жыйынтык төмөндө сүрөттө келтирилген. Айтыш керек, текст жакшы таанылган. Мындан тышкары, абдан тез - мен 5-10 секунд күттүм.
2) //www.i2ocr.com/
Бул кызмат жогорудагыдай эле иштейт. Бул жерде сиз файлды жүктөп алып, таануу тилин тандап, текстти чыгарып алуу баскычын чыкылдатыңыз. Кызмат абдан тез иштейт: 5-6 секунд. бир бет.
Колдоого алынган форматтар: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Бул онлайн кызматтын натыйжасы бир топ ыңгайлуу: сиз эки терезени көрөсүз - биринчи, таануунун жыйынтыгы, экинчисинде - баштапкы сүрөт. Ошондуктан, сиз түзөтүп жатканда оңдоп-түзөө жетиштүү. Баса, кызматка катталуунун дагы кереги жок.
3) //www.newocr.com/
Бул кызмат бир нече жол менен уникалдуу. Биринчиден, ал "newfangled" DJVU форматын колдойт (айтмакчы, форматтардын толук тизмеси: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Экинчиден, ал сүрөттөгү тексттин аймактарын тандоону колдойт. Сүрөттөгү текст тилкелери гана эмес, ошондой эле сиз тааныбай турган графикалык аймактарыңыз болсо, бул абдан пайдалуу.
Таануу сапаты орточо жогору, каттоонун кажети жок.
4) //www.free-ocr.com/
Таануу үчүн абдан жөнөкөй кызмат: сүрөттү жүктөп, тилин белгилеп, captcha киргизиңиз (айтмакчы, ушул жерде ушул кызматты аткарган жалгыз кызмат) жана баскычты басып, сүрөттү текстке которуңуз. Чындыгында баары!
Колдоого алынган форматтар: PDF, JPG, GIF, TIFF, BMP.
Таануу натыйжасы орто. Каталар бар, бирок көп эмес. Бирок, баштапкы скриншоттун сапаты жогору болсо, ката кетирилгенде, ката кетирүү ирети көбүрөөк болмок.
PS
Бүгүнкү күндө ушунун бардыгы. Текстти таануу боюнча кызыктуу кызматтарды билсеңиз - комментарийде бөлүшүңүз, мен ыраазы болом. Бир шарт: каттоонун кереги жок жана кызмат акысыз.
Баары мыкты!