در این مقاله قصد داریم شما را با تفاوت دو تکنولوژی OMR و OCR آشنا کنیم. OMR یا Optical Mark Recognition و OCR یا Optical Character Recognition هر دو روش هایی برای بدست آودن اطلاعات از درون تصاویر یا کاغذها و تبدیل کردن آن به اطلاعات دیجیتال هستند. در بسیاری اوقات اینگونه تصور می شود که هر دوی این روش ها یکسان عمل می کنند اما تفاوت های واضحی بین روش عملکرد OMR و OCR وجود دارد. وظیفه اصلی OMR این است که تشخیص دهد در یک منطقه تعریف شده از یک تصویر یا عکس یک علامت وجود دارد یا خیر؟ و کار OMR تقریبا در اینجا تمام می شود اما OCR ضمن اینکه باید تشخیص دهد یک علامت در جایی از عکس یا تصویر وجود دارد یا خیر، بایستی تشخیص دهد که علامت مورد نظر دقیقا چیست و کاراکتر متناظر با آن علامت را به اطلاع درخواست کننده برساند.
در OCR کاملا فرآیندهایی که انجام می شوند و دقت عملی که وجود دارد بستگی به زبان مورد استفاده برای OCR دارند چه بسا زبان فارسی یکی از دشوارترین زبان ها برای انجام فرآیند های تشخیص کاراکترها یا OCR است.
هدف اصلی OCR این است که یک مستند که چاپ شده است یا متنی که تبدیل به تصویر یا عکس شده است را از درون آن بیرون کشیده و تبدیل به کاراکترهای متنی کند. همانطور که می دانید اگر شما یک متن را تبدیل به عکس کنید دیگر چیزی به نام کاراکتر وجود نخواهد داشت و همه آنها تبدیل به پیکسل های عکس می شوند و دیگر قابل ویرایش نخواهند بود.
در OCR نرم افزار مربوطه تلاش می کند که از داخل این عکس پرینت شده یا تصویر موجود در کامپیوتر کاراکترهای متنی را شناسایی کند و این کاراکترها را در کنار هم قرار داده و تبدیل به متن قابل ویرایش در انواع نرم افزارهای پردازش کلمات کند، در چنین حالتی معمولا کل مستند اولیه یا همان عکس تبدیل به یک ساختار جدید می شود.
اما دقت کنید که با توجه به اینکه ساختار کاری OCR بر اساس الگوریتم ها و الگوهایی است که از قبل برای شناسایی کاراکترها در عکس ها طراحی شده است و با توجه به اینکه در زبان های مختلف ساختار کلمات و حروف و در کنار هم قراردادن آنها و حتی فونت های مختلف باعث می شوند که ساختار OCR یک ساختار کاملا و 100 درصد دقیق نداشته باشد و در نهایت خروجی فایل متنی به احتمال زیاد نیاز به ویرایش و بازنگری خواهد داشت اما به هر حال OCR باعث می شود که نیاز شما به ایجاد کردن مجدد کل مستند کاهش پیدا کند.
اگر بخواهیم OMR را با OCR مقایسه کنیم باید بگوییم که هدف اصلی در OMR و بیشتری استفاده ای که از آن می شود جدول بندی کردن و ارزیابی کردن داده ها و در نهایت خروجی گرفتن از تعداد زیادی از مستندات است. بهترین مثالی که می توانیم از سیستم های OMR بزنیم تصحیح کردن امتحانات کنکور و پاسخنامه های موجود برای میلیون ها داوطلب است.
تمامی این پاسخنامه ها توسط سیستم های OMR تصحیح می شوند، در چنین ساختاری اندازه پاسخبرگ ها به همراه الگوی تصحیح که در آن مکان و مختصات پاسخ درست عنوان شده است در اختیار سیستم OMR قرار می گیرد و سیستم فقط پاسخبرگهای داوطلبین را به این شکل بررسی می کند که آیا در مختصات مورد نظر رنگ به اندازه مناسب تغییر کرده است یا خیر و به این شکل میلیون ها برگه پاسخبرگ با استفاده از مکانیزم OMR در کمترین زمان ممکن تصحیح می شوند و نمرات اعلام می شود قطعا چنین فرآیندی با انجام دادن یک فرآیند دستی برای صحیح کردن پاسخبرگهای امتحانی قابل مقایسه نیست.