Hide metadata

dc.date.accessioned2013-03-12T08:09:18Z
dc.date.available2013-03-12T08:09:18Z
dc.date.issued2011en_US
dc.date.submitted2011-05-06en_US
dc.identifier.citationBerg, Øyvind Raddum. High precision text extraction from PDF documents. Masteroppgave, University of Oslo, 2011en_US
dc.identifier.urihttp://hdl.handle.net/10852/8893
dc.description.abstractOppgaven tar for seg problemet med uthenting av informasjon fra dokumenter lagret i PDF-formatet, noe som er vanskelig på grunn av at informasjonen blir lagret visuelt og uten en god struktur. I oppgaven blir det sett på bruk og tilpassning av teori hentet fra OCR for å prøve å gjenopprette denne tapte strukturen.nor
dc.description.abstractThe project looks at the problem of extracting information from documents created in the PDF format, something which is made difficult because the information is stored visually and lacks a computer-readable structure. The thesis presents how existing theory from OCR is being used and adapted to try to recover this structure.eng
dc.language.isoengen_US
dc.titleHigh precision text extraction from PDF documentsen_US
dc.typeMaster thesisen_US
dc.date.updated2011-11-14en_US
dc.creator.authorBerg, Øyvind Raddumen_US
dc.subject.nsiVDP::420en_US
dc.identifier.bibliographiccitationinfo:ofi/fmt:kev:mtx:ctx&ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:dissertation&rft.au=Berg, Øyvind Raddum&rft.title=High precision text extraction from PDF documents&rft.inst=University of Oslo&rft.date=2011&rft.degree=Masteroppgaveen_US
dc.identifier.urnURN:NBN:no-28122en_US
dc.type.documentMasteroppgaveen_US
dc.identifier.duo120077en_US
dc.contributor.supervisorStephan Oepenen_US
dc.identifier.bibsys114802858en_US
dc.identifier.fulltextFulltext https://www.duo.uio.no/bitstream/handle/10852/8893/1/Berg.pdf


Files in this item

Appears in the following Collection

Hide metadata