p i x         Recherche d'illustrations multicollections Image Retrieval




La recherche sur le critère "mot clé" ne tient pas compte des frontières entre mots.
Au contraire, la recherche avancée est tokenisée (découpage en mots, casse, accents et ponctuation supprimés). Il est possible de préciser plusieurs mots-clés en les séparant par une virgule et en les combinant avec un opérateur :
- au moins un (OU logique) : "verdun,vaux,douaumont"
- tous (ET logique) : "fort,vaux"
- tous proches (distance de 10 mots, sans ordre) : "bataille,Verdun"
- tous proches et ordonnés (distance de 10 mots avec ordre)
- phrase (séquence de mots): "fort de Vaux"

Des jokers peuvent être utilisés :
.  : tout caractère
.?  : zéro ou un caractère
.*  : zéro ou plusieurs caractères. Exemple : "diplomat.*"
.+  : un ou plusieurs caractères

Une dernière option est la recherche floue, qui compense en partie les erreurs OCR.
Search on the "keywords" criteria is tokenised (division into words, removal of case, accents and punctuation).

It is possible to specify several keywords by separating them with a comma and combining with an operator:
- any (logical OR) : "verdun,vaux,douaumont"
- all (logical AND) : "fort,vaux"
- all closed (window of 10 words, no order) : "bataille,Verdun"
- all closed and ordered (window of 10 words, ordered)
- phrase (sequence of words): "fort de Vaux"

Wildcards can be used:
.  : any character
.?   : zero or one character
.*  : zero or more characters. Exemple : "diplomat.*"
.+  : one or more characters

One last option is the fuzzy search, which partly compensates for OCR errors


Collections


Collections Gallica source des illustrations : presse, revue, monographie, image, carte, partition musicale

Titre : titre de périodique ou titre de l'oeuvre. Exemples :
- régiment
- Gaulois | Matin (recherche dans plusieurs titres)
- guerre.*aérienne (jokers)
De/à : date de publication au format jj/mm/aaaa
Thème : classification IPTC
Supplément (pour les périodiques uniquement) : restreindre aux suppléments
Publicité (pour les périodiques uniquement) : restreindre aux pages contenant de la publicité
En une/Dernière (pour les périodiques uniquement) : restreindre au première ou dernière pages

Gallica source collections of the illustrations: newspapers, journals, monographies, images, maps, musical scores
Title: work title or newspaper title. Examples:
régiment
Gaulois | Matin (searching in multiple titles)
guerre.*aérienne (wildcards)
From/To: publication date (jj/mm/aaaa)
Theme: IPTC classification
Supplement (for serials only): search only in supplements
Ad (for serials only): search only in pages including ads
Front page/Last page (for serials only): search only in front/last pages

Image 

Document



Classification


Ces critères interrogent le contenu des images.

Personne, concept : concepts de la classification automatique par reconnaissance visuelle, avec opérateur booléen sur un critère mot clé. Exemples : soldier, vehicle, car, airplane, officer, sport...
Couleur : gris, monochrome (sépia, cyanotype...), couleur
Les couleurs (bleu, rouge, vert...) sont issues de la classification par reconnaissance visuelle
Genre de l'illustration (gravure, photo, etc.)
Taille (de la plus petite illustration à la plus grande (A8 à A2) : restreindre aux illustrations de plus grande taille que le critère
Densité (pour les imprimés uniquement, nombre d'illustrations par page) : restreindre aux pages de plus grande densité d'illustration que le critère

These criteria query the content of images.

Person, concept : concepts of automatic classification by visual recognition (IBM Watson), with boolean operator on keyword criterion. Examples: soldier, vehicle, car, airplane, officer, sport...
Color : grayscale, monochrome (sepia, cyanotype...), color
The color classes (blue, red, green...) are derived from the visual recognition classification
Type of the illustration (engravure, photo, etc.)
Size (from the smallest illustration to the largest, A8 to A2): search only in illustrations which have a greater size than the criteria
Density (for printed contents only, number of illustrations in a page, from 1 to 50): search only in pages which have a greater density than the criteria

    Concept 
  

    

Présentation Presentation Contact GitHub CGU TOS