光学文字認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ポータブルスキャナを使ってリアルタイムで光学文字認識 (OCR) を行っている動画

: Optical character recognition使[1]OCR

使使


[]


2[2]1914[]

OCR1929OCR1933WOCR 1,915,9931935 2,026,329

1949RCA使OCR[3]

1950AFSAH "Gismo" [4]1953 2,663,758Gismo23 Intelligent Machines Research Corporation (IMR) OCRGismo  IMR Gismo IMR

1955使15002000[2]2使IMR1950IBMOCR

1965RCA使OCRRCAOCR-A RCA 301 TWA使1,500RCA

便1965OCR使OCR便1965便OCR使便1971OCR使OCR使便使

196871便便OCR1998便7OCR使

[]


1974OCR Kurzweil Computer Products, Inc. [ 1]CCD19761131978OCR使2 Scansoft Scansoft [5]

2000OCR (WebOCR) OCR使使  OCR OCR API 使 OCR API

OCR

[]


OCR  OCR OCR OCR OCR  OCR 





N





[6]

[7]

:

:Google



CAPTCHAOCR[8][9][10]CAPTCHA



CAD

PDF 

OCR

SpotOCR

[]


 (OCR)

1



使1OCR

 (ICR)

1

 (IWR)

1

OCR  OCR API  使[11]

[]

[]


OCR使[12]











[13][14][15][16]















 OCR [17]



OCR 

[18]

[19]

[]


 OCR 2[20]



""""""OCR



  1OCR使[21]k[22]

CuneiformTesseract2使2使2[19]

OCRopus  Tesseract OCR 使

 OCR  OCR  OCR 使[23]

OCR ALTO XML hOCR  PAGE XML 

[]


使OCR [12]Tesseract 使[19]

 OCR  PDF 

"" 使[24]Washington, D.C.Washington DOC



OCR API  OCR 使[25]

[]


 OCR  OCR []OCROCRIDOCR

OCR15,400[26]

[]


OCR

[]


OCR-AOCR-BMICR便OCRArialTimes New RomanOCRGoogle TesseractOCR-AOCR-BMICR[27]

1[24]OCR[24]

Palm OSGraffiti使調

OCROCR

[]


OCRAmazon Mechanical Turk reCAPTCHAALTOOCR[28][29]

認識精度[編集]


1990 (DOE)  (ISRI) 使5 Annual Test of OCR Accuracy [30]

1001920使OCR71%98%[31]

使使99%5%[32]

[33]OCRPenPoint OS 

Palm OSApple Newton80%90%1

使稿使98%

脚注[編集]

注釈[編集]

  1. ^ カーツワイルは書体を選ばないOCR技術の発明者とされることもあるが、1960年代末ごろから同様の技術を開発する企業がいくつか出現している。詳しくは Schantz, The History of OCR; Data processing magazine, Volume 12 (1970), p. 46 を参照

出典[編集]



(一)^ OnDemand, HPE Haven. OCR Document. 20164152016415

(二)^ abHerbert Schantz, The History of OCR. Manchester Center, VT: Recognition Technologies Users Association, 1982.

(三)^ "Reading Machine Speaks Out Loud" , February 1949, Popular Science.

(四)^ Washington Daily News, April 27, 1951; New York Times, December 26, 1953

(五)^  ScanSoft Nuance . japan.internet.com. (2005510). http://japan.internet.com/finanews/20050510/11.html 

(六)^ Qing-An Zeng (28 October 2015). Wireless Communications, Networking and Applications: Proceedings of WCNA 2014. Springer. ISBN 978-81-322-2580-5. https://books.google.com/books?id=vCnUCgAAQBAJ 

(七)^ Using OCR and Entity Extraction for LinkedIn Company Lookup (2014722). 20164172017616

(八)^ How To Crack Captchas.  andrewt.net (2006628). 2013616

(九)^ Breaking a Visual CAPTCHA.  Cs.sfu.ca (20021210). 2013616

(十)^ John Resig (2009123). John Resig  OCR and Neural Nets in JavaScript.  Ejohn.org. 2013616

(11)^ Tappert, C. C.; Suen, C. Y.; Wakahara, T. (1990). The state of the art in online handwriting recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence 12 (8): 787. doi:10.1109/34.57669. https://semanticscholar.org/paper/a5b3ce16666f0d9a7ac1636370a58838a7843b0f. 

(12)^ abOptical Character Recognition (OCR)  How it works.  Nicomsoft.com. 2013616

(13)^ Sezgin, Mehmet; Sankur, Bulent (2004). Survey over image thresholding techniques and quantitative performance evaluation. Journal of Electronic Imaging 13 (1): 146. Bibcode: 2004JEI....13..146S. doi:10.1117/1.1631315. October 16, 2015. https://web.archive.org/web/20151016080410/http://webdocs.cs.ualberta.ca/~nray1/CMPUT605/track3_papers/Threshold_survey.pdf 201552. 

(14)^ Gupta, Maya R.; Jacobson, Nathaniel P.; Garcia, Eric K. (2007). OCR binarisation and image pre-processing for searching historical documents.. Pattern Recognition 40 (2): 389. doi:10.1016/j.patcog.2006.04.043. October 16, 2015. https://web.archive.org/web/20151016080410/http://www.rfai.li.univ-tours.fr/fr/ressources/_dh/DOC/DocOCR/OCRbinarisation.pdf 201552. 

(15)^ Trier, Oeivind Due; Jain, Anil K. (1995). Goal-directed evaluation of binarisation methods.. IEEE Transactions on Pattern Analysis and Machine Intelligence 17 (12): 11911201. doi:10.1109/34.476511. http://heim.ifi.uio.no/inf386/trier2.pdf 201552. 

(16)^ Milyaev, Sergey; Barinova, Olga; Novikova, Tatiana; Kohli, Pushmeet; Lempitsky, Victor (2013). Image binarisation for end-to-end text understanding in natural images.. Document Analysis and Recognition (ICDAR) 2013 12th International Conference on: 128132. doi:10.1109/ICDAR.2013.33. ISBN 978-0-7695-4999-6. https://www.microsoft.com/en-us/research/wp-content/uploads/2016/11/mbnlk_icdar2013.pdf 201552. 

(17)^ Pati, P.B.; Ramakrishnan, A.G. (1987-05-29). Word Level Multi-script Identification. Pattern Recognition Letters 29 (9): 12181229. doi:10.1016/j.patrec.2008.01.027. 

(18)^ Basic OCR in OpenCV | Damiles.  Blog.damiles.com (20081120). 2013616

(19)^ abcRay Smith (2007). An Overview of the Tesseract OCR Engine. 20109282013523

(20)^ OCR Introduction.  Dataid.com. 2013616

(21)^ How OCR Software Works.  OCRWizard. 20098162013616

(22)^ The basic pattern recognition and classification with openCV | Damiles.  Blog.damiles.com (20081114). 2013616

(23)^ http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch-bool.html&r=1&f=G&l=50&co1=AND&d=PTXT&s1=10,679,089&OS=10,679,089&RS=10,679,089

(24)^ abcHow does OCR document scanning work?.  Explain that Stuff (2012130). 2013616

(25)^ How to optimize results from the OCR API when extracting text from an image? - Haven OnDemand Developer Community. 201632220201221

(26)^ Fehr, Tiff, How We Sped Through 900 Pages of Cohen Documents in Under 10 Minutes, Times Insider, The New York Times, March 26, 2019

(27)^ Train Your Tesseract. Train Your Tesseract (2018920). 2018920

(28)^ What is the point of an online interactive OCR text editor? - Fenno-Ugrica (2014221). 20201221

(29)^ Riedl, C.; Zanibbi, R.; Hearst, M. A.; Zhu, S.; Menietti, M.; Crusan, J.; Metelsky, I.; Lakhani, K. (20 February 2016). Detecting Figures and Part Labels in Patents: Competition-Based Development of Image Processing Algorithms. International Journal on Document Analysis and Recognition 19 (2): 155. arXiv:1410.6751. doi:10.1007/s10032-016-0260-8. 

(30)^ The Fifth Annual Test of OCR Accuracy. 2012427

(31)^ Holley, Rose (20094). How Good Can It Get? Analysing and Improving OCR Accuracy in Large Scale Historic Newspaper Digitisation Programs.  D-Lib Magazine. 201115

(32)^ Suen, C.Y., et al (1987-05-29). Future Challenges in Handwriting and Computer Applications. 3rd International Symposium on Handwriting and Computer Applications, Montreal, May 29, 1987. http://users.erols.com/rwservices/pens/biblio88.html#Suen88 2008103. 

(33)^ Tappert, Charles C., et al (1990-08). The State of the Art in On-line Handwriting Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 12 No 8, August 1990, pp 787-ff. http://users.erols.com/rwservices/pens/biblio90.html#Tappert90c 2008103. 

関連項目[編集]

外部リンク[編集]