ocr – -Translation – Keybot Dictionary

Spacer TTN Translation Network TTN TTN Login Deutsch Français Spacer Help
Source Languages Target Languages
Keybot 15 Results  www.earlydutchbooksonline.nl
  Technique | Early Dutch...  
Optical Character Recognition (OCR) so that key words can be used to search the text
optische tekenherkenning (OCR) zodat gezocht kan worden op woorden in de tekst;
  Faqs | Early Dutch Book...  
At present, this is not possible for either the plain OCR text or the text in PDF format.
Voor zowel de platte, ge-OCR'de tekst als voor de tekst in PDF-formaat is dat op dit moment niet mogelijk.
  Faqs | Early Dutch Book...  
If I use a Dutch word like "opstellen", I also want to see pages containing the word "opftellen", because I know that OCR software often reads the "long S" as an "f". Why is this option not available?
Als ik op een woord als "opstellen" zoek, wil ik ook bladzijden met "opftellen" kunnen vinden, omdat ik weet dat een "lange s" door de OCR- software vaak als "f" gelezen wordt. Waarom kan dit niet?
  Faqs | Early Dutch Book...  
If you are referring to the plain, OCR text, this is not possible at the moment. You can only download this page by page. You can, however, download the entire book as a PDF file and convert that to a plain text file.
Als u de platte, ge-OCR'de tekst bedoelt, dan kan dat op dit moment niet. U kunt dit slechts pagina voor pagina doen. U kunt echter wel het hele boek als PDF downloaden en dat bestand naar platte tekst converteren.
  Technique | Early Dutch...  
Highly damaged books, ones that are extremely fragile and books of which scanning with OCR will not provide satisfactory results are not included in the selection. In addition, during the material processing it is determined whether the books contain illustrations or folding maps.
Boeken die te kwetsbaar zijn, niet goed open kunnen of waarvan bijvoorbeeld de OCR geen goed resultaat zal opleveren, zijn uit de selectie verwijderd. Daarnaast is tijdens de materiaalvoorbewerking bekeken of er uitklapbare kaarten en prenten in de boeken zitten. Deze boeken zijn apart gedigitaliseerd.
  Faqs | Early Dutch Book...  
Good image quality produces the best OCR results. Character recognition is of utmost importance for properly making the materials available to the public. The better the character recognition, the more information the website visitor will be able to find.
Het accent ligt op "Nederlands materiaal", dat wil zeggen: in Nederland gedrukt of handelend over Nederland. De Nederlandse taal kan niet als strikt selectiecriterium worden gehanteerd, omdat Nederlands niet de standaard taal was voor uitgaven in die tijd; op de universiteiten Latijn gebruikt en aan het hof werd Frans gesproken. Voor het project is daarom zowel Nederlands- als Franstalig materiaal meegenomen. Zie Selectiecriteria voor meer informatie
  Faqs | Early Dutch Book...  
Good image quality produces the best OCR results. Character recognition is of utmost importance for properly making the materials available to the public. The better the character recognition, the more information the website visitor will be able to find.
Het accent ligt op "Nederlands materiaal", dat wil zeggen: in Nederland gedrukt of handelend over Nederland. De Nederlandse taal kan niet als strikt selectiecriterium worden gehanteerd, omdat Nederlands niet de standaard taal was voor uitgaven in die tijd; op de universiteiten Latijn gebruikt en aan het hof werd Frans gesproken. Voor het project is daarom zowel Nederlands- als Franstalig materiaal meegenomen. Zie Selectiecriteria voor meer informatie
  Quality | Early Dutch B...  
Good quality images guarantee optimal optical character recognition (OCR). Character recognition is of the utmost importance given that it guarantees that the materials can be made available to the public as desired.
Goede beeldkwaliteit zorgt voor een optimaal OCR-resultaat. De tekenherkenning is van groot belang voor een goede ontsluiting van het materiaal. Hoe beter de tekenherkenning, hoe meer informatie de bezoeker van de website kan vinden. De tekenherkenning bij het project Early Dutch Books Online heeft te maken met enkele specifieke problemen. Zo wijkt bijvoorbeeld de spelling af die gebruikt wordt in de periode 1781-1800 en worden lettertekens gebruikt die nu niet meer gangbaar zijn. De lange "s" zag eruit als f. De software herkent deze letter niet als een "s" maar leest een "f".
  Technique | Early Dutch...  
In the preparatory stage, the material preparers closely examine every book and decide whether it qualifies for inclusion in the digitization process. Whether the physical condition is sufficient and whether the book is suitable for scanning with optical character recognition (OCR) are determined for each book.
Ten behoeve van de digitalisering wordt eerst een materiaalvoorbewerking uitgevoerd. De boeken worden van tevoren stuk voor stuk beoordeeld op hun fysieke staat. Van elk boek wordt bepaald of de fysieke conditie voldoende is en of het boek geschikt is voor scanning en Optical Character Recognition(OCR). Met OCR wordt van de gescande pagina automatisch een tekstbestand gemaakt. Hiervoor moeten de karakters op de pagina goed herkend worden door de scanapparatuur.
  Technique | Early Dutch...  
In the preparatory stage, the material preparers closely examine every book and decide whether it qualifies for inclusion in the digitization process. Whether the physical condition is sufficient and whether the book is suitable for scanning with optical character recognition (OCR) are determined for each book.
Ten behoeve van de digitalisering wordt eerst een materiaalvoorbewerking uitgevoerd. De boeken worden van tevoren stuk voor stuk beoordeeld op hun fysieke staat. Van elk boek wordt bepaald of de fysieke conditie voldoende is en of het boek geschikt is voor scanning en Optical Character Recognition(OCR). Met OCR wordt van de gescande pagina automatisch een tekstbestand gemaakt. Hiervoor moeten de karakters op de pagina goed herkend worden door de scanapparatuur.
  Quality | Early Dutch B...  
Good quality images guarantee optimal optical character recognition (OCR). Character recognition is of the utmost importance given that it guarantees that the materials can be made available to the public as desired.
Goede beeldkwaliteit zorgt voor een optimaal OCR-resultaat. De tekenherkenning is van groot belang voor een goede ontsluiting van het materiaal. Hoe beter de tekenherkenning, hoe meer informatie de bezoeker van de website kan vinden. De tekenherkenning bij het project Early Dutch Books Online heeft te maken met enkele specifieke problemen. Zo wijkt bijvoorbeeld de spelling af die gebruikt wordt in de periode 1781-1800 en worden lettertekens gebruikt die nu niet meer gangbaar zijn. De lange "s" zag eruit als f. De software herkent deze letter niet als een "s" maar leest een "f".
  Faqs | Early Dutch Book...  
Good image quality produces the best OCR results. Character recognition is of the utmost importance for properly making the materials available to the public. The better the character recognition, the more information the website visitor will be able to find.
Goede beeldkwaliteit zorgt voor een optimaal OCR-resultaat. De tekenherkenning is van groot belang voor een goede ontsluiting van het materiaal. Hoe beter de tekenherkenning, hoe meer informatie de bezoeker van de website kan vinden. De tekenherkenning bij het project Early Dutch Books Online heeft te maken met enkele specifieke problemen. Zo wijkt bijvoorbeeld de spelling af die gebruikt wordt in de periode 1781-1800 en worden lettertekens gebruikt die nu niet meer gangbaar zijn. De lange "s" zag eruit als f. De software herkent deze letter niet als een "s" maar leest een "f".
  Faqs | Early Dutch Book...  
For example, eighteenth-century materials printed in the Netherlands were chosen because this is when the 'modern', Roman, type became predominant. Materials printed in Roman type are suited to OCR, which is why only books in Roman type are digitised.
De term 'Bijzondere Collecties' wordt gebruikt voor zeer uiteenlopend materiaal dat om welke reden dan ook zeldzaam, kostbaar en vaak ook kwetsbaar is. Het materiaal uit de Bijzondere Collecties wordt bewaard in depots die zijn voorzien van beveiliging en klimaatbeheersing. Het betreft oude gedrukte publicaties uit verschillende landen en in allerlei talen. Naast de gedrukte werken is er een grote hoeveelheid geschreven materiaal in de bibliotheken aanwezig, variërend van middeleeuwse manuscripten, latere handschriften, waaronder archieven van geleerden en kunstenaars, tot meer dan een miljoen brieven. Verder zijn er collecties kaarten en atlassen, prenten, foto's, sierpapier, boekbanden en typografisch materiaal.
  Faqs | Early Dutch Book...  
Good image quality produces the best OCR results. Character recognition is of the utmost importance for properly making the materials available to the public. The better the character recognition, the more information the website visitor will be able to find.
Goede beeldkwaliteit zorgt voor een optimaal OCR-resultaat. De tekenherkenning is van groot belang voor een goede ontsluiting van het materiaal. Hoe beter de tekenherkenning, hoe meer informatie de bezoeker van de website kan vinden. De tekenherkenning bij het project Early Dutch Books Online heeft te maken met enkele specifieke problemen. Zo wijkt bijvoorbeeld de spelling af die gebruikt wordt in de periode 1781-1800 en worden lettertekens gebruikt die nu niet meer gangbaar zijn. De lange "s" zag eruit als f. De software herkent deze letter niet als een "s" maar leest een "f".
  Selection | Early Dutch...  
In the eighteenth century, the 'modern' (Roman) type gradually became more predominant. Material printed in Roman is much more suitable for Optical Character Recognition (OCR) than the Gothic material.
Voor aanvang van het project zijn enkele selectiecriteria opgesteld. Zo is gekozen voor materiaal dat in de achttiende eeuw in Nederland is gedrukt, omdat in deze periode het 'moderne' lettertype, Romein, de overhand krijgt. In Romein gedrukt materiaal is goed te OCR'en. Daarom worden alleen de boeken in Romeinsschrift gedigitaliseerd. Het project omvat niet de gehele achttiende eeuw maar beperkt zich tot 1781-1800 omdat publicaties in deze tijd voornamelijk in Romein gedrukt werden. Deze keuze is gebaseerd op de overweging dat op deze wijze niet alleen het grootste aantal werken onder handen kan worden genomen, maar ook dat de kans op succesvolle digitalisering van de tekst het grootst is. Inhoudelijke overwegingen speelden bij deze eerste selectie dus minder een rol.