A. P. En-pratique, C. Des, . Et, . Des, . Et et al., UNICODE 5, 2008.

A. Actes and . The, CONCEPTION, TH MULTIDISCIPLINARY SYMPOSIUM ON DESIGN AND EVALUATION OF DIGITAL CONTENT FOR EDUCATION CIUDAD REAL, pp.15-17, 2011.

A. F. Allah, B. S. Computational, . Processing, . Less, . Languages et al., TOWARD, 2012.

A. F. Allah, FINITE-STATE TRANSDUCER FOR AMAZIGH VERBAL MORPHOLOGY. LITERARY & LINGUISTIC COMPUTING, 2014.

A. F. Allah and . Boulaknadel-s, AMAZIGH VERB CONJUGATOR, ACTES DE THE 9 TH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, 2014.

B. Sociolinguistiques, . Revue-de-l-'universite, . De-moncton, . Numero, and . Serie, L, pp.81-89, 2007.

B. S. Ataa, A. F. Pour, . Le-developpement-d-'un-corpus, A. De-la-langue-amazighe-», L. De et al., INITIATIVE, 2012.

B. S. Ataa, A. F. Standard, . Corpus, . Advances, . In et al., BUILDING, PROCEEDING OF THE INTERNATIONAL CONFERENCE ON INTELLIGENT HUMAN COMPUTER INTERACTION, vol.179, pp.91-98, 2011.

B. S. Talha-m, A. D. Amazighe, . Named, . Entity, . Using et al., AICCSA'2014), IEEE INTERNATIONAL CONFERENCE ON COMPUTER SYSTEMS AND APPLICATIONS, pp.10-12, 2014.

E. For, . Morphosyntactic, . C. Of, . Eagles, . Eag-tcwg-mac-/-r et al., RECOMMENDATION, ILC.CNR.IT, 1996.

E. Azrak, N. , E. A. De, E. Actes-du-4, . Atelier et al., REFERENTIEL, CONSTRUCTION ET EXPLOITATION, 2011.

K. K. General, . Model, . Word-form, . Recognition, T. Production et al., TWO-LEVEL MORPHOLOGY: A, 1984.

M. N. Ataa, A. F. , T. De-l-'international, . Conference, . Information et al., SENTENCE, pp.4-6, 2017.

N. F. Boulaknadel-s and A. D. , AMAMORPH: FINITE STATE MORPHOLOGICAL ANALYZER FOR AMAZIGHE, JOURNAL OF COMPUTING AND INFORMATION TECHNOLOGY, pp.91-110, 2016.

S. , F. Psycholinguistic, . Of, . And, . To-read et al., UNDERSTANDING READING: A, 2004.

Z. L. Ait and O. Rabat, ??????, 2008.

B. C. Fort-k and . Sagot-b, TCOF-POS : un corpus libre de français parlé annoté en morphosyntaxe, JEP-TALN 2012 -Journées d'Études sur la Parole et conférence annuelle du Traitement Automatique des Langues Naturelles, pp.99-112, 2012.

J. Eloy and E. , Standardisation et vitalité des langues de France, volume 9 of Carnets d'Ateliers de Sociolinguistique, 2014.

G. G. Tapanainen-p, What is a word, What is a sentence ? Problems of Tokenization, 3rd International Conference on Computational Lexicography (COMPLEX'94), 1994.

J. B. Würzner-k.-m, Word and Sentence Tokenization with Hidden Markov Models, JLCL, vol.28, issue.2, pp.61-83, 2013.

K. B. Daul-l, L'alsacien pour les nuls, 2010.

L. Dipper-s, An Annotation Scheme for the Comparison of Different Genres of Social Media with a Focus on Normalization, Proceedings of the LREC Workshop on Normalisation and Analysis of Social Media Texts (NormSoMe), 2016.

R. C. Lavergne-t and . Névéol-a, Etiquetage morpho-syntaxique en domaine de spécialité : le domaine médical, Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles, 2015.

S. P. Kauss-a, Kochersberg : récits en dialecte avec version française, 1998.

W. J. Kit, Tokenization as the initial phase in NLP, Proceedings of the 14th conference on Computational linguistics, pp.1106-1110, 1992.

W. J. Stetson-p and . B. Johnson-s, An unsupervised machine learning approach to segmentation of clinician-entered free text, AMIA Annual Symposium Proceedings, 2007.

Z. E. Crévenat-werner, Orthographe alsacienne : bien écrire l'alsacien de Wissembourg à Ferrette, Colmar : J. Do Bentzinger, 2008.

A. Abeillé, M. Candito, and A. Kinyon, FTAG : current status and parsing scheme, Proceedings of Vextal '99, pp.283-292, 1999.

J. Bos, Predicate Logic Unplugged, Proceedings of the tenth Amsterdam Colloquium, 1995.

M. Candito, Organisation Modulaire et Paramétrable de Grammaires Electroniques Lexicalisées, 1999.

N. Chomsky, Syntactic Structures. The Hague : Mouton, 1957.

B. Crabbé, D. Duchier, C. Gardent, L. Roux, J. Parmentier et al., XMG: eXtensible MetaGrammar, Computational Linguistics, vol.1, issue.3, pp.591-629, 2013.
DOI : 10.1111/j.1467-8640.2005.00273.x

D. Duchier, M. Ekoukou, B. Parmentier, Y. Petitjean, S. Schang et al., Décrire la morphologie des verbes en ikota au moyen d'une métagrammaire, 19e conférence sur le Traitement Automatique des Langues Naturelles (TALN 2012) -Atelier sur le traitement automatique des langues africaines, pp.97-106, 2012.

R. Evans and G. Gazdar, DATR : a language for lexical knowledge representation, Computational Linguistics, vol.22, issue.2, pp.167-216, 1996.

A. K. Joshi, L. S. Levy, and M. Takahashi, Tree adjunct grammars, Journal of Computer and System Sciences, vol.10, issue.1, pp.136-163, 1975.
DOI : 10.1016/S0022-0000(75)80019-5

URL : http://doi.org/10.1016/s0022-0000(75)80019-5

T. Lichte and S. Petitjean, Implementing semantic frames as typed feature structures with XMG, Journal of Language Modelling, vol.3, issue.1, pp.185-228, 2015.
DOI : 10.15398/jlm.v3i1.96

URL : http://doi.org/10.15398/jlm.v3i1.96

M. Ekoukou and B. , Description de l'Ikota (B25), langue bantu du Gabon. Implémentation de la morphosyntaxe et de la syntaxe, 2015.
URL : https://hal.archives-ouvertes.fr/tel-01347722

S. Petitjean, Génération Modulaire de Grammaires Formelles, 2014.

S. Petitjean, D. Duchier, and Y. Parmentier, XMG2 : Describing Description Languages, 2016.
DOI : 10.1007/978-3-662-53826-5_16

URL : https://hal.archives-ouvertes.fr/hal-01361316

C. A. Prolo, Generating the XTAG english grammar using metarules, Proceedings of the 19th international conference on Computational linguistics -, pp.814-820, 2002.
DOI : 10.3115/1072228.1072381

URL : http://acl.ldc.upenn.edu/C/C02/C02-1153.pdf

J. Rogers and K. Vijay-shanker, OBTAINING TREES FROM THEIR DESCRIPTIONS: AN APPLICATION TO TREE-ADJOINING GRAMMARS, Computational Intelligence, vol.18, issue.4, pp.401-421, 1994.
DOI : 10.1111/j.1467-8640.1994.tb00005.x

URL : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.31.7476

B. Sagot, L. Clément, É. De-la-clergerie, and P. Boullier, The Lefff 2 syntactic lexicon for French : architecture, acquisition, use, LREC 06, pp.1-4, 2006.
URL : https://hal.archives-ouvertes.fr/hal-00413071

E. Schang, D. Duchier, M. Ekoukou, B. Parmentier, Y. Petitjean et al., Describing São Tomense Using a Tree-Adjoining Meta-Grammar, 11th International Workshop on Tree Adjoining Grammars and Related Formalisms (TAG+11), pp.82-89, 2012.

S. M. Shieber, The design of a computer language for linguistic information, pp.362-366, 1984.

L. Villemonte-de and É. Clergerie, Building factorized TAGs with meta-grammars, TAG+10, pp.111-118, 2010.
URL : https://hal.archives-ouvertes.fr/inria-00551974

F. Xia, Automatic Grammar Generation from two Different Perspectives, 2001.

M. T. Sutskever-i, C. K. , C. G. , and D. J. , Distributed representations of phrases and their compositionality, NIPS, 2013.

B. S. Dipper-s, . Eisenberg-p, . S. Hansen-schirra, L. W. König-e, R. C. et al., TIGER : Linguistic Interpretation of a German Corpus, Research on Language and Computation, pp.597-620, 2004.

B. M. Thomas, Batelòc : cap a una basa informatisada de tèxtes occitans, IXème Congrès International de l'Association Internationale d'Études Occitanes, pp.661-670, 2008.

C. M. Seddah-d, Le corpus Sequoia : annotation syntaxique et exploitation pour l'adaptation d'analyseur par pont lexical, TALN 2012 -19e conférence sur le Traitement Automatique des Langues Naturelles, 2012.

D. P. Sagot-b, Coupling an annotated corpus and a morphosyntactic lexicon for state-of-the-art POS tagging with less human effort, 2009.

T. K. Klein-d, . D. Manning-c, and . Singer-y, Feature-rich Part-of-speech Tagging with a Cyclic Dependency Network, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology, pp.173-180, 2003.

V. and C. M. Urieli-a, Analyse morphosyntaxique de l'occitan languedocien : l'amitié entre un petit languedocien et un gros catalan, TALARE 2015, 2015.

Y. D. and N. G. Wicentowski-r, Inducing multilingual text analysis tools via robust projection across aligned corpora, Proceedings of the first international conference on Human language technology research, pp.1-8, 2001.

S. Pronoms and . On-notera, Table 2) que les SN sont en majorité des Syntagmes Nominaux Sans Déterminants (SNSD)

. Dans and . Gadelii, on trouve l'idée que les SNSD du CG sont principalement des sujets reprenant un topique (continued topics), 2007.

A. and L. A. Schang-e, Codage en chaîne ou en première mention de la coréférence : Approcher la structure des chaînes de référence par comparaison des deux annotations, SHS Web of Conferences, pp.27-02001, 2016.

A. Schang-e, M. J. , L. A. Pelletier-a, . Eshkol-i, . D. Mau-rel et al., Corpus ANCOR_Centre, 2013.

B. M. Guéron-j, Noun phrases in creole languages : a multi-faceted approach, 2007.

D. A. Landragin-f, L. A. Tellier-i, and A. , Coreference Resolution for Oral Corpus : a machine learning experiment with ANCOR corpus, Traitement Automatique des Langues, vol.55, issue.2, pp.97-121, 2015.

D. S. Zinsmeister-h, Annotating abstract anaphora, Language Resources and Evaluation, vol.46, issue.1, pp.37-52, 2012.

G. J. and H. M. Borthen-k, Cognitive status, information structure, and pronominal reference to clausally introduced entities, Journal of Logic, Language and Information, vol.12, issue.3, pp.281-299, 2003.

L. A. and A. Schang-e, Le corpus ANCOR_Centre et son outil de requêtage : application à l'étude de l'accord en genre et nombre dans les coréférences et anaphores en français parlé, SHS Web of Conferences, pp.2691-2706, 2014.

M. H. Fattier-d, L'utilisation des déterminants en créole haïtien, 2011.

M. J. , L. A. , A. Schang-e, M. D. , and V. J. Eshkol-i, ANCOR, premier corpus de français parlé d'envergure annoté en coréférence et distribué librement, pp.555-563, 2013.

R. M. and H. E. Martí-m, Identity, non-identity, and near-identity : Addressing the complexity of coreference, Lingua, vol.121, issue.6, pp.1138-1152, 2011.

R. Potau and M. , Coreferència : Teoria, anotació, resolució i avaluació, 2010.

W. A. Mathet-y, The Glozz platform : a corpus annotation and mining tool, Proceedings of the 2012 ACM symposium on Document engineering, pp.171-180, 2012.

Z. and H. A. Jean-louis, From noun to name : definiteness marking in modern martinikè, Crosslinguistic studies on Noun Phrase structure and reference, pp.269-315, 2013.

L. Abouda and O. Baude, Du français fondamental aux ESLO. Colloque international Français fondamental, corpus oraux, contenus d'enseignement. 50 ans de travaux et d'enjeux, 2005.

L. Abouda and O. Baude, Constituer et exploiter un grand corpus oral : choix et enjeux théoriques Le cas des ESLO Corpus en Lettres et Sciences sociales ? Des documents numériques à l'interprétation, actes du XXVII colloque d'Albi, Langages et signification, 2006.

L. Abouda, Syntaxe et Sémantique en corpus Du temps et de la modalité en français oral, mémoire HDR, 2015.

O. Baude, Corpus oraux, Guide des bonnes pratiques, CNRS éditions et P.U.O, 2006.
URL : https://hal.archives-ouvertes.fr/halshs-01184593

O. Baude, Le droit de la parole, dans Bilger, Mireille (éd.). Données orales : les enjeux de la transcription, 2008.

S. Benjelloun, Une double graphie, latine et arabe, pour enseigner l'arabe marocain, 2002.

G. Bergounioux, « L'Etude socio-linguistique sur Orléans (1966-1991), 25 ans d'histoire d'un corpus», Langue française, pp.74-93, 1992.
DOI : 10.3406/lfr.1992.5812

M. Bilger and P. Cappeau, L'oral ou la multiplication des styles, Langage et soci?t?, vol.109, issue.3, pp.13-30, 2004.
DOI : 10.3917/ls.109.0013

M. Bilger, Les enjeux des choix orthographiques dans Bilger, Mireille (éd.) Données orales ? Les enjeux de la transcription, pp.248-257, 2008.

C. Blanche-benveniste and C. Jeanjean, Le français parlé : transcription et édition, 1987.

N. Boukadida, Connaissances phonologiques et morphologiques dérivationnelles et apprentissage de la lecture en arabe, 2008.

P. Bourdieu, (sous la direction de) La misère du monde, 2003.

D. Caubet, Arabe maghr?bin : passage ? l'?crit et institutions, Faits de Langues, pp.235-244, 1999.
DOI : 10.3406/flang.1999.1257

D. Caubet, Arabe maghrébin, langue de France : entre deux graphies, 2002.

J. Chaker, Sibille (éds), Codification des langues de France, pp.331-340, 2002.

F. Gadet, Derrière les problèmes méthodologiques du recueil des données, dans M. Bilger (dir, Linguistique sur corpus, 2000.

F. Gadet, L'oreille et l'oeil à l'écoute du social Données orales: les enjeux de la transcription, pp.35-47, 2008.

B. Habert, A. Nazarenko, and A. Salem, Les linguistiques de corpus, 1997.
URL : https://hal.archives-ouvertes.fr/hal-00619268

B. Habert, Des corpus représentatifs : de quoi, pour quoi, comment ?, dans M. Bilger (dir, Linguistique sur corpus, 2000.

S. Khoja, Arabic part-of-speech tagger, Proceedings of the Student Workshop at the Second Meeting of the North American Chapter, pp.81-86, 2001.

G. Leech, Introduction corpus annotation Corpus annotation: Linguistic information from computer text corpora, pp.1-18, 1997.

B. Maurer, Quelles méthodes d'enquête sont effectivement employées aujourd'hui en sociolinguistique, dans L, Calvet et P. Dumont (dir.), L'enquête sociolinguistique, L'Harmattan, 1999.

L. Mondada, La transcription dans la perspective de la linguistique interactionnelle, dans Bilger, Mireille (éd.) Données orales : les enjeux de la transcription, pp.78-109, 2008.