Abstract
I denne oppgaven undersøker vi metoder for å ekstrahere skjemaer fra dokumentdatabaser i MongoDB. Dokumentdatabaser har vokst frem som et populært alternativ til relasjonsdatabaser, og har fått stor medvind de siste årene. Vi skal se på problematikk rundt valget av dokumentdatabaser og MongoDB som databaseteknologi, og se på grunner til å migrere til et relasjonssystem. Oppgaven ser på hvordan vi kan trekke ut skjemainformasjon på et konseptuelt nivå, som kan brukes videre i forarbeidet til en databasemigrering. Vi bruker Object-Role Model (ORM) som formalisme for dette. Vi har designet algoritmer som kan brukes til å automatisere skjemaekstraksjoner. Algoritmene er implementert i Java og testet på datasett hentet fra MongoDB. Vi demonstrerer at det er mulig å trekke ut et skjema fra en skjemaløs dokumentdatabase under noen antakelser på hvordan dokumentene er formet. Vi diskuterer hvilke metoder som lar seg automatisere, og for hvilke metoder automatisering er mer utfordrende.