روش OCR فارسی مبتنی بر زیرکلمات

او سی آر (OCR) به تکنیکی اطلاق می شود که طی آن یک برنامه کامپیوتری متون موجود در تصاویر دیجیتالی را شناسایی کرده و آن‌ها را به صورت خودکار به فایل‌های متنی قابل ویرایش و جست‌وجو تبدیل می‌کند. OCR زبان‎های فارسی و عربی نسبت به زبان انگلیسی پیچیدگی بیشتری دارد. تعداد حروف الفبای بیشتر، پیوسته بودن حروف هنگام نوشتن، نقطه دار بودن حروف و تغییر فرم نوشتاری حروف در ابتدا، وسط یا انتهای کلمات از جمله مهم...
ocr چیست

گاهی اوقات ممکن است به یک دست نوشته و یا سند تایپی بر بخورید که بخواهید یک نسخه دیجیتالی از آن را در اختیار داشته باشید، اولین راهی که به ذهنتان می‌رسد تایپ آن توسط اپراتور است که این خود کار زمانبری است، اما فناوری OCR و یا نویسه خوان نوری به شما این امکان را می‌دهد که در عرض چند ثانیه با استفاده از اسکنر (یا دوربین دیجیتال) و نرم‌افزار Optical Character Recognition که معادل فارسی آن "نویسه خوان ...