La versión en español de Wikipedia define corpus lingüístico como un conjunto, habitualmente muy amplio, de ejemplos reales de uso de una lengua. Estos ejemplos pueden ser textos (lo más común) o muestras orales (generalmente transcritas). Se denomina lingüística de corpus al estudio de la lengua a través de estas muestras.
Enlaces para buscar frases de ejemplo:
- Google y otros buscadores: texto entrecomillado para buscar coincidencia exacta
- http://www.webcorp.org.uk/live/ "WebCorp is a suite of tools which allows access to the World Wide Web as a corpus"
- http://corpus.byu.edu/ created by Mark Davies, Professor of Linguistics at Brigham Young University
- http://www.wordandphrase.info/academic/analyzeText.asp Academic Vocabulary
- http://corpora.informatik.uni-leipzig.de/ University of Leipzig’s Wortschatz-Portal (Creo que hay que escribir entre comillas, si son varias palabras)
- Creo que los siguientes enlaces usan la misma base de datos (British National Corpus):

