روش OCR فارسی مبتنی بر زیرکلمات

او سی آر (OCR) به تکنیکی اطلاق می شود که طی آن یک برنامه کامپیوتری متون موجود در تصاویر دیجیتالی را شناسایی کرده و آن‌ها را به صورت خودکار به فایل‌های متنی قابل ویرایش و جست‌وجو تبدیل می‌کند. OCR زبان‎های فارسی و عربی نسبت به زبان انگلیسی پیچیدگی بیشتری دارد. تعداد حروف الفبای بیشتر، پیوسته بودن حروف هنگام نوشتن، نقطه دار بودن حروف و تغییر فرم نوشتاری حروف در ابتدا، وسط یا انتهای کلمات از جمله مهم...
تفاون OMR و OCR

در این مقاله قصد داریم شما را با تفاوت دو تکنولوژی OMR و OCR آشنا کنیم. OMR یا Optical Mark Recognition و OCR یا Optical Character Recognition هر دو روش هایی برای بدست آودن اطلاعات از درون تصاویر یا کاغذها و تبدیل کردن آن به اطلاعات دیجیتال هستند. در بسیاری اوقات اینگونه تصور می شود که هر دوی این روش ها یکسان عمل می کنند اما تفاوت های واضحی بین روش عملکرد OMR و OCR وجود دارد. وظیفه اصلی OMR این اس...