Trabajo ya realizado:
- Recopilación de frases en distintas bases de datos.
- Normalización de las bases de datos para que coincidan entre sí.
- Unificación en una sola base de datos de frases ordenadas por verbo característico.
- Borrado de frases duplicadas.
- Primera corrección de erratas y mejoras en la traducción.
- Duplicado o triplicado de frases con dos o más verbos característicos.
- Duplicado de frases con verbo "semiauxiliar" (Dori, Putea, Vrea...). No todas, solo una selección para que no sea muy repetitivo.
- Ordenado de frases por orden alfabético para detectar frases duplicadas que no contengan más de un verbo o frases que se han triplicado por error.
- Añadido de vocabulario procedente de las mismas fuentes que las frases (unas 8 fuentes diferentes, unas 7 bases de datos)
- Clasificación del vocabulario por "temática", se prueban varias formas de clasificar hasta que se llega a unas 94 categorías.
- 2ª corrección de erratas con vocabulario incluido.
- Estadísticas del documento por verbos.
Trabajo por realizar:
- Volver a ordenar las frases por verbo característico.
- Obtener lista de los verbos más comunes, verbos irregulares, fórmulas conversacionales, y verbos semiauxiliares más comunes para futuras entradas en el blog y para nuevos planteamientos didácticos.
- Completar vocabulario por categorías, sólo lo imprescindible para no pasar mucho más allá de las 8500 líneas. Por ejemplo, completar días de la semana, meses del año, etc.
- Pasar las listas de frases en Excel a tablas de frases en Word.
- Reordenar categorías de vocabulario para pasarlas a tablas de Word.
- Maquetar y paginar la parte de las tablas.
- Redactar introducción.
- Control final de erratas.
- Portada.
- Edición final, conversión a PDF.
- Publicación.
Líneas previstas entre 8400 y 8600
Fecha prevista de publicación entre el 15 de febrero y el 30 de mayo.
Quiero Aprender Rumano
No hay comentarios:
Publicar un comentario