Die Texterkennung als Herausforderung bei der Digitalisierung von Tabellen

Am Beispiel des Projektes für belgische historische Zählungen (KU Leuven Libraries Economics and Business)

Autor*innen

DOI:

https://doi.org/10.5282/o-bib/5584

Schlagwörter:

Digitalisierung, Texterkennung, OCR

Abstract

Bereits seit mehr als 5000 Jahren finden Volkszählungen statt. Während sie ursprünglich nur zur Steuererhebung und zu militärischen Zwecken durchgeführt wurden, dienten sie später auch der wissenschaftlichen Forschung. Die ersten Zählungen, die von Anfang an auch der Forschung zur Verfügung standen, wurden 1846 unter der Leitung von Adolphe Quetelet in Belgien durchgeführt. Diese Zählungen wurden in regelmäßigen Abständen wiederholt. Da die Analyse dieser Zählungen aufgrund ihres Umfanges und ihres Formats sehr aufwendig ist, ist es sinnvoll, die dort enthaltenen Informationen mit Hilfe von Retrodigitalisierung und elektronischer Texterkennung aufzubereiten. Die wirtschaftswissenschaftliche Bibliothek der KU Leuven (Belgien) arbeitet zur Zeit an einem Projekt, das sich zum Ziel gesetzt hat, die gedruckten Ausgaben der belgischen Industriezählungen von 1846 bis 1947 als Excel-Kalkulationstabellen anzubieten. In diesem Artikel wird sowohl auf die damit verbundenen Herausforderungen eingegangen als auch die Arbeitsweise beschrieben.

Literaturhinweise

Bracke, Nele: Een monument voor het land. Overheidsstatistiek in België 1795-1870, Gent 2008. Online: https://www.oapen.org/search?identifier=366390 (Stand: 29.04.2020).

Černý, Jaroslav: Consanguineous Marriages in Pharaonic Egypt, in: Journal of Egyptian Archeology 40, 1954, S. 28–29. Online: https://www.jstor.org/stable/3855544 (Stand: 29.04.2020).

Clausner, Christian; Antonacopoulos, Apostolos; Henshaw, Christy u.a.: Towards the Extraction of Statistical Information from Digitised Numerical Tables: The Medical Officer of Health Reports Scoping Study, in: DATeCH2019: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel, 2019, S. 65-71. Online: https://doi.org/10.1145/3322905.3322932 (Stand: 29.04.2020).

Klep, Paul: Politieke strubbelingen rond de volkstelling 1859, Voorburg, 2007. Online: http://www.volkstelling.nl/nl/documentatie/1859/rede_pklep/index.html (Stand: 29.04.2020).

March, Lucien: Le recensement des industries en Belgique en 1896, in: Journal de la société statistique de Paris 43, 1902, S. 257-267.

Project Belgische historische tellingen. Online: https://bib.kuleuven.be/ebib/project-belgische-historische-tellingen/project_bht (Stand: 29.04.2020).

Statistique de la Belgique: Industrie, recensement général (15 octobre 1846). Online: http://resolver.libis.be/IE11452503/representation (Bild) und http://resolver.libis.be/IE13011283/representation (Durchsuchbarer Text + Excel-Kalkulationstabelle)

Tenney, Frank: Roman Census Statistics from 508 to 225 B.C., in: The American Journal of Philology 51 (4), 1930, S. 313–324. Online: https://www.jstor.org/stable/289892 (Stand: 29.04.2020).

Downloads

Veröffentlicht

12.05.2020

Ausgabe

Rubrik

Aufsätze

Zitationsvorschlag

Die Texterkennung als Herausforderung bei der Digitalisierung von Tabellen: Am Beispiel des Projektes für belgische historische Zählungen (KU Leuven Libraries Economics and Business). (2020). O-Bib. Das Offene Bibliotheksjournal Herausgeber VDB, 7(2), 1-13. https://doi.org/10.5282/o-bib/5584