ocr چیست

فناوری OCR یا نویسه خوان نوری چیست

گاهی اوقات ممکن است به یک دست نوشته و یا سند تایپی بر بخورید که بخواهید یک نسخه دیجیتالی از آن را در اختیار داشته باشید، اولین راهی که به ذهنتان می‌رسد تایپ آن توسط اپراتور است که این خود کار زمانبری است، اما فناوری OCR و یا نویسه خوان نوری به شما این امکان را می‌دهد که در عرض چند ثانیه با استفاده از اسکنر (یا دوربین دیجیتال) و نرم‌افزار Optical Character Recognition که معادل فارسی آن “نویسه خوان نوری” است متن خود را به فرمت قابل ویرایش تبدیل کنید.

در اینجا شما را بیشتر با این فناوری آشنا می کنیم، با ما همراه باشید:

OCR یا نویسه خوان نوری چیست؟

OCR که کوچک شده عبارت Optical Character Reader است، تکنولوژی است که به شما این امکان را می‌دهد تا صفحات حاوی متنی که اسکن کرده‌اید را از فرمت عکس به متن تبدیل کنید. دانشجویان، مترجمان و… که مقالات و متون مختلفی را اسکن می‌کنند، به راحتی می‌توانند با تبدیل این فایل‌ها به متن از تایپ مجدد آنها رها شوند.

بعد از آنکه تصویر حاوی متن را اسکن می‌کنیم، رایانه پردازشی را بر روی تصویر انجام می‌دهد. ابتدا تصویر را به قسمت‌ها یا پارتیشن‌های مجزا تقسیم می‌کند. بعد با استفاده از الگوریتم‌های پردازش تصویر و هوش مصنوعی حروف کاراکترهایی را از درون متن استخراج می‌کند. اما ممکن است متن شما هنگام عکسبرداری چرخیده باشد. در نتیجه کامپیوتر عکس را چند درجه می‌چرخاند و باز عمل قبل را بر روی آن انجام می‌دهد و نتیجه را به دست می‌آورد. البته در اکثر موارد کار به همین راحتی که گفته می‌شود نیست و کلی عملیات پیچیده دیگر باید روی تصویر انجام بگیرد.

انواع OCR

فناوری OCR به دو نوع تایپی و دست نویس تقسیم می‌شود؛ یعنی یا باید یک متن که از قبل تایپ شده (مانند مجله، کتاب، روزنامه و یا …) را وارد رایانه کنیم، یا متون دست نویس را.

متون دست نویس نیز به دو دسته «گسسته» و «پیوسته» تقسیم می‌شوند: متون پیوسته متونی هستند که ما به طور روزانه آنها را می‌نویسیم مانند روزنوشته‌ها، خاطرات، نامه و … ، و اما متون گسسته متونی هستند که در آنها حروف جدا از هم نوشته می‌شوند، مانند فرم‌های اطلاعاتی که نام و نام خانوادگی خود را در آنها به صورت هر حرف داخل یک کادر می‌نویسیم.
بدیهی است که OCR متون گسسته، کار بسیار راحت تری نسبت به مدل پیوسته است.

OCR چگونه کار می کند؟

اگر روند کار OCR را به صورت یک جعبه سیاه در نظر بگیریم، تصویر اسناد مورد نظر ورودی آن و خروجی آن فایل متنی دیجیتالی (مثلاً به فرمت Word) از متن سند است. با دریافت تصویر یک سند، ابتدا فرآیند، تحلیل محتوا می‌شود و نواحی مختلف اطلاعاتی در تصویر شناسایی می‌شوند.