P i x         Recherche d'illustrations multicollections Image Retrieval



English form French form

La recherche sur le critère "mot clé" ne tient pas compte des frontières entre mots.
Au contraire, la recherche avancée est tokenisée (découpage en mots, casse, accents et ponctuation supprimés). Il est possible de préciser plusieurs mots-clés en les séparant par une virgule et en les combinant avec un opérateur :
- au moins un (OU logique) : "verdun,vaux,douaumont"
- tous (ET logique) : "fort,vaux"
- tous proches (distance de 10 mots, sans ordre) : "bataille,Verdun"
- tous proches et ordonnés (distance de 10 mots avec ordre)
- phrase (séquence de mots): "fort de Vaux"

Des jokers peuvent être utilisés :
.  : tout caractère
.?  : zéro ou un caractère
.*  : zéro ou plusieurs caractères. Exemple : "diplomat.*"
.+  : un ou plusieurs caractères

Une dernière option est la recherche floue, qui peut compenser les erreurs OCR.
Search on the "keywords" criteria is tokenised (division into words, removal of case, accents and punctuation).

It is possible to specify several keywords by separating them with a comma and combining with an operator:
- any (logical OR) : "verdun,vaux,douaumont"
- all (logical AND) : "fort,vaux"
- all closed (window of 10 words, no order) : "bataille,Verdun"
- all closed and ordered (window of 10 words, ordered)
- phrase (sequence of words): "fort de Vaux"

Wildcards can be used:
.  : any character
.?   : zero or one character
.*  : zero or more characters. Exemple : "diplomat.*"
.+  : one or more characters

One last option is the fuzzy search, which partly compensates for OCR errors


Collections


Collections Gallica source des illustrations : presse, revue, monographie, image, carte, partition musicale

Titre : titre de périodique ou titre de l'oeuvre. Exemples :
- régiment
- Gaulois | Matin (recherche dans plusieurs titres)
- guerre.*aérienne (jokers)
De/à : date de publication au format jj/mm/aaaa
Thème : classification IPTC (cette métadonnée ne couvre pas toute la base)
Supplément (pour les périodiques uniquement) : restreindre aux suppléments
En une/Dernière (pour les périodiques uniquement) : restreindre au première ou dernière pages

Gallica source collections of the illustrations: newspapers, journals, monographies, images, maps, musical scores
Title: work title or newspaper title. Examples:
régiment
Gaulois | Matin (searching in multiple titles)
guerre.*aérienne (wildcards)
From/To: publication date (jj/mm/aaaa)
Theme: IPTC classification (this metadata doesn't cover all the database)
Supplement (for serials only): search only in supplements
Ad (for serials only): search only in pages including ads
Front page/Last page (for serials only): search only in front/last pages

Image 

Document



Classification


Reconnaissance visuelle : Ces critères interrogent le contenu des images.

Personne, Concept : concepts produits par reconnaissance visuelle (CBIR). Plusieurs sources sont interrogeables (IBM Watson Visual Recognition, Google Cloud Vision, OpenCV/dnn).
Les critères Personne (visage, personne, soldat, etc.) et Concept interrogent par défaut toutes les sources. Une source unique peut être choisie (via le critère CBIR) et dans ce cas, le vocabulaire de la source utilisée est listé. NB : Les critères Personne et le vocabulaire avec majuscule à l'initiale (par ex. Boat) opérent avec des synonymes (par ex. boat, ship, cruiser...).
Les critères Personne et Concept peuvent être combinés avec les autres critères (opérateur booléen ET/OU).
Mode colorimétrique de l'illustration : gris, monochrome (sépia, cyanotype...), couleur
Couleur dominante de l'illustration : les couleurs (bleu, rouge, vert...) sont issues de la reconnaissance visuelle (toutes sources confondues)
Genre de l'illustration : gravure, photo, carte, etc.
Taille (de la plus petite illustration à la plus grande) : filtrer les illustrations de plus petite taille que le critère
Densité (pour les imprimés uniquement, nombre d'illustrations par page) : filtrer les pages de plus petite densité d'illustration que le critère

These criteria query the content of images.

Person, concept : concepts of automatic classification by visual recognition (CBIR). Several sources are available (IBM Watson Visual Recognition, Google Cloud Vision, OpenCV/dnn).
The Person criteria (face, person, soldier...) and Concept criteria request all the sources. An unique source can be targeted (thanks to the CBIR criteria) and the vocabulary of the used source is listed. Note: the Person criteria and the vocabulary with capital letters at initial (e.g. Boat) use synonyms (e.g. boat, cruiser, ship...).
Examples: soldier, vehicle, car, airplane, officer, sport, horse...
The Person and Concept criteria can be combined with the others criteria (operator AND/OR).
Color : grayscale, monochrome (sepia, cyanotype...), color
The color classes (blue, red, green...) are derived from the visual recognition classification
Type of the illustration : engravure, photo, map, etc.
Size (from the smallest illustration to the largest): filter the illustrations which are smaller than the criteria
Density (for printed contents only, number of illustrations in a page, from 1 to 50): filter the pages which have a smaller density than the criteria

  Concept 
  

       .

GallicaPix, c'est quoi ? GallicaPix, what's that? Contact GitHub CGU TOS