Universidade de Coimbra | www.uc.pt

link voltar a UC.PT Universidade de Coimbra
Imagem de identificação do subsite Imagem de apresentação do subsite
Imprimir Tamanho de Letra Normal Aumentar Tamanho da Letra Aumentar Tamanho da Letra

Corpus de Produções Escritas de Aprendentes de PL2 (PEAPL2)

Dados

Nota importante para utilizadores do Corpus PEAPL2 até 11 de fevereiro de 2015:

Ao acervo inicialmente disponibilizado, correspondente à fase 1 da recolha de textos (entre maio de 2009 e maio de 2010), foram, a partir de 11 de fevereiro de 2015, acrescentados novos dados, recolhidos na fase 2 (entre janeiro e maio de 2011). Os ficheiros relativos à fase 2 encontram-se devidamente assinalados e podem ser descarregados autonomamente.

Ficheiros

Ficheiros organizados por LM do informante

Ficheiros organizados por nível do Quadro Europeu Comum de Referência para as Línguas (QECRL) da turma frequentada pelo informante

Informantes

Os materiais do corpus foram produzidos por 458 sujeitos (391 na fase 1 da recolha e 67 na fase 2) de ambos os sexos, com idades compreendidas entre os 16 e os 68 anos. São falantes de 39 LM diferentes (informação recolhida através de auto-testemunho) e representam cerca de 50 nacionalidades distintas. 

Obtenha, aqui, o ficheiro excel com os perfis dos informantes. Os dados da fase 2 da recolha encontram-se agrupados no fim deste ficheiro excel, devidamente assinalados (fase 2 da recolha).  

Sobre os textos

O corpus é atualmente constituído por 142171 palavras (119 381 recolhidas na fase 1 e 22790 na fase 2), distribuídas por 629 textos (546 recolhidos na fase 1 e 83 na fase 2). Ocorrem, em média, 226 palavras por texto/recolha.

Nr. textos por estímulo:
Fase 1 Fase 2 Total
O indivíduo = 342 1.1A 80 4 84
  6.1B 111 23 134
  33.1J 118 6 124
A sociedade = 94 50.2L 40 11 51
  52.2L 29 3 32
  55.2M 10 1 11
O meio ambiente = 193 69.3Q 57 23 80
  75.3S 4 5 46
   77.3T 60 7 67
Nr. textos por LM do informante:
 Fase 1Fase 2Total
Alemão81889
Árabe11
Baoulé11
Basco11
Búlgaro51
Catalão516
Checo22628
Chinês (Cantonês e Mandarim)42446
Coreano99
Croata145
Dinamarquês11
Eslovaco55
Esloveno22
Espanhol551368
Farsi44
Finlandês213
Francês281038
Galego9110
Grego55
Hindi145
Húngaro33
Inglês57663
Italiano77683
Japonês12315
Letão22
Lituano516
Neerlandês18826
Polaco27229
Romeno15116
Russo1111
Sueco22
Tagalo11
Tailandês11
Tétum11
Turco99
Ucraniano55
Ucraniano/ Russo11
Checo/ Eslovaco11
Checo/ Húngaro11
Hindi/ Sindi22
Alemão/ Francês11
Alemão/ Turco22
Alemão/ Espanhol22
Basco/ Espanhol22
Espanhol/ Galego33
Espanhol/ Catalão44
Alemão/ Português11
Inglês/Português11
Francês/ Português112
Nr. textos por nível da turma frequentada pelo informante:

Nível do QECRLFase 1Fase 2Total
A1/A1+111111
A2 /A2+117117
B1251251
B2 434891
C1243559
© University of Coimbra · 2009
Portugal/WEST GMT · S:
Símbolo de Acessibilidade à Web.Loja VirtualAviso LegalComentáriosContactosMapa do Sitevoltar ao topo
POS_C FEDER
QWeb Boas Praticas