זיהוי תווים אופטי (Optical Character Recognition או OCR) מאפשר קידוד טקסט כתוב למידע דיגיטאלי. מדובר בתהליך הכולל סריקה או צילום טקסט והעברתו לקובץ תמונה; למעשה, זהו תהליך הפוך מהדפסת המסמך, המאפשר חיפוש מידע גם במסמכים סרוקים. תוכנת ה-OCR מזהה את המילים בתמונה ומתרגמת אותן למידע דיגיטלי; לכל אות יש מבנה אופייני, ובתהליך הזיהוי מזהה התוכנה את המאפיינים הייחודיים ואת האות. תהליך זה עלול ליצור כמות מסוימת של תווים שגויים, ולכן חלק מתוכנות ה-OCR מפעילות בדיקה מול מילון. על פי הספקים, טכנולוגיה זו מגיעה בעברית במעל 99% זיהוי מדויק, כשמדובר במסמכי מקור או בעותק מדור ראשון.