Switch Language

CORPUS, DONNÉES, MODÈLES : approches qualitatives et quantitatives

Catégorie
Date
Jeu, 06/09/2011 - ven, 06/10/2011
Date limite d'inscription

Salle des Colloques, CNRS, Montpellier

http://praxiling.univ-montp3.fr/spip.php?article240

Date limite des propositions : 31 OCTOBRE 2010

La notion de corpus est relativement consensuelle en sciences du langage. Il
n'est pas rare de considérer que la constitution d'observables linguistiques à
partir de données empiriques issues de l'usage est un préalable fondamental à
toute théorisation sur la langue. L'ensemble des données recueillies par le
chercheur est généralement défini comme «l'univers du discours». Le corpus se
définit quant à lui comme l'ensemble des données recueillies soumises à
l'analyse.

Si la majorité des linguistes s'accorde sur le caractère nécessaire de la
constitution d'un corpus comme base de toute théorisation, un certain nombre de
problèmes se pose inévitablement.

C'est pourquoi la nouvelle édition 2011 du colloque Jeunes Chercheurs Praxiling
souhaite appréhender les différentes approches du corpus, interroger les
méthodes de constitution et de traitement de corpus ainsi que sa place et sa
pertinence dans l'analyse.

Une grande attention sera accordée aux communications qui contribueront à
développer des pistes de réflexion autour des thèmes suivants :

§ Recueil des données

§ Constitution du corpus

§ Éthique et constitution de corpus

§ Traitement du corpus

§ Pertinence du corpus

§ Corpus driven / corpus based

§ Multimodalité et corpus vidéos

§ Corpus oraux

§ Analyse et traitement des corpus textuels, oraux/vidéos

Du point de vue méthodologique, en amont, on peut constater qu'il existe
d'importantes différences dans les pratiques de constitution de corpus et dans
leur traitement. Les diverses conceptions de la notion de corpus renvoient à des
domaines hétérogènes en sciences du langage qui font appel à des méthodes de
traitement variées.

On peut ainsi se demander dans quelle mesure un corpus peut être exhaustif,
comment se sélectionne et se délimite un corpus, comment il se constitue et
quelle est la nature des données (recueil des données audio, vidéo, numérique,
notes, observations ethnographiques). Peut-on et doit-on fixer un seuil minimum
du nombre d'occurrences permettant de considérer qu'un corpus est pertinent ?
Quelles méthodes sont mises en oeuvre pour recueillir ces données? Comment
motiver ses choix pour élaborer un corpus en vue d'une analyse multimodale
(corpus vidéos et corpus d'interactions numériques) ? Comment prendre en compte
les problèmes éthiques dans le recueil des données ?

Du point de vue scientifique, un corpus pourrait se définir comme une sélection
aléatoire d'un ensemble d'énoncés ayant pour but d'être représentatif d'un état
de langue à un moment donné. Or, la recherche scientifique s'inscrit dans une
démarche se voulant objective et basée sur des données irréfutables. Par
conséquent, il semble légitime de se demander en quoi un corpus est
représentatif.
Dans quelle
mesure peut-il être considéré comme valide et pertinent dans le
cadre d'une théorisation ? L'hétérogénéité de ses éléments tout comme la
subjectivité inhérente aux choix opérés par le chercheur ne constituent-elles
pas un obstacle à la démarche scientifique ? Le corpus a été présenté ici comme
un composant essentiel de la recherche. On peut cependant s'interroger sur la
place qui est accordée au corpus dans l'analyse des données : quelle différence
peut-on établir entre les analyses fondées sur corpus (/corpus-based/) et les
analyses guidées par corpus (/corpus-driven/)?

Enfin, dans une perspective allant au-delà de la recherche particulière, on peut
questionner le lien qui existe entre un corpus et l'objet de recherche : peut-on
prétendre élaborer des corpus de référence permettant une pluralité de recherche
ou bien n'est-il valide que pour une recherche précise à un moment donné ?

***

*Public concerné*

Sont invités à proposer une communication les jeunes chercheurs issus de tout
domaine scientifique dont l'objet d'étude est lié au corpus. Ce colloque devrait
permettre de réunir et de confronter les travaux de jeunes chercheurs portant
sur plusieurs domaines scientifiques : linguistique, sociologie, psychologie,
information et communication.

*Soumissions*

Les propositions de *communication* *orales *ou* affichées* devront comporter
500 mots au maximum (références exclues). Les auteurs devront soumettre leur
communication par un *formulaire *sur le site de Praxiling avant le 31 octobre
2010.

Les propositions seront examinées anonymement par deux membres du comité
scientifique.

Les propositions acceptées donneront lieu à une communication de 20 minutes + 5
minutes de questions.

Les posters scientifiques seront affichés durant la totalité du colloque et une
séance sera consacrée à leur présentation.

*Actes du colloque*

Le colloque donnera lieu à la publication d'une sélection de communications dans
un ouvrage. Il sera demandé aux auteurs d'envoyer leurs articles avant le 15
mars 2011.

*Le colloque en baladodiffusion*

Le colloque sera entièrement disponible en vidéo sur la plateforme de
baladodiffusion Parole de Chercheurs.<http://www.paroledechercheurs.net/&gt;.

Ce site promeut la diffusion du savoir scientifique par la mise en ligne de
conférences.

*Dates importantes*

Date limite de soumission des propositions : 31 octobre 2010

Notification d'acceptation : 15 Décembre 2010

Envoi des articles définitifs : 15 mars 2011

Date du Colloque : 9-10 Juin 2011

Organizer
Réseau
PRAXILING UMR 5267 (ITIC UM3-CNRS)