domingo, 31 de enero de 2016

Trabajando en el nuevo Banco de Frases (3)


Después de una semana dedicada casi por entero a desatascar la clasificación del vocabulario, por fin veo la luz y comienzo a poder pasar las frases al documento de Word para darle el formato definitivo. Esta parte será con diferencia la que más tiempo lleve, y me vendrá muy bien aprender algunos atajos en Excel y Word para acelerar el proceso.

El tema de clasificar las palabras ha sido el primero que me ha llevado el tiempo inicialmente previsto y no he podido adelantar fechas. ¿Por qué resulta tan complicado clasificar las palabras en categorías? Hace unos años me surgió la misma pregunta y un amigo me lo aclaró con una pregunta: ¿En qué categoría pondrías la palabra "preservativo"? ¿En salud? ¿En higiene? ¿En ocio y diversión? o, si es de sabores, ¿en alimentación?
Si bien la mayoría de las palabras encajan en una sola categoría, y otras se pueden meter en dos o tres, por su significado múltiple como "gato" (animal, herramienta), o "cáncer" (enfermedad, signo del zodiaco), palabras como la expuesta "preservativo", aún refiriéndose a un solo significado, admiten su inclusión en varias categorías. Esto es solo una muestra de las pequeñas dificultades que he tenido que ir solventando. De hecho, me han dado más trabajo las aproximadamente 2000 palabras que las 6500 frases que tendrá el Banco de Frases.

Resumiendo: La parte de trasladar las frases de Excel a Tablas de Word me llevará semanas.
Líneas: entre 8400 y 8450. De las cuales unas 6500 frases y el resto vocabulario. Algunas frases van repetidas por tener más de un verbo.
Fecha de publicación prevista: entre el 20 de febrero y el 20 de Mayo.

Quiero Aprender Rumano

lunes, 25 de enero de 2016

Trabajando en el nuevo Banco de Frases (2)


Trabajo ya realizado:

  • Recopilación de frases en distintas bases de datos.
  • Normalización de las bases de datos para que coincidan entre sí.
  • Unificación en una sola base de datos de frases ordenadas por verbo característico.
  • Borrado de frases duplicadas.
  • Primera corrección de erratas y mejoras en la traducción.
  • Duplicado o triplicado de frases con dos o más verbos característicos.
  • Duplicado de frases con verbo "semiauxiliar" (Dori, Putea, Vrea...). No todas, solo una selección para que no sea muy repetitivo.
  • Ordenado de frases por orden alfabético para detectar frases duplicadas que no contengan más de un verbo o  frases que se han triplicado por error.
  • Añadido de vocabulario procedente de las mismas fuentes que las frases (unas 8 fuentes diferentes, unas 7 bases de datos)
  • Clasificación del vocabulario por "temática", se prueban varias formas de clasificar hasta que se llega a unas 94 categorías.
  • 2ª corrección de erratas con vocabulario incluido.
  • Estadísticas del documento por verbos.

Trabajo por realizar:

  • Volver a ordenar las frases por verbo característico.
  • Obtener lista de los verbos más comunes, verbos irregulares, fórmulas conversacionales, y verbos semiauxiliares más comunes para futuras entradas en el blog y para nuevos planteamientos didácticos.
  • Completar vocabulario por categorías, sólo lo imprescindible para no pasar mucho más allá de las 8500 líneas. Por ejemplo, completar días de la semana, meses del año, etc.
  • Pasar las listas de frases en Excel a tablas de frases en Word.
  • Reordenar categorías de vocabulario para pasarlas a tablas de Word.
  • Maquetar y paginar la parte de las tablas.
  • Redactar introducción.
  • Control final de erratas.
  • Portada.
  • Edición final, conversión a PDF.
  • Publicación.
Líneas previstas entre 8400 y 8600

Fecha prevista de publicación entre el 15 de febrero y el 30 de mayo.

Quiero Aprender Rumano

domingo, 17 de enero de 2016

Trabajando en el nuevo Banco de Frases (1)


Pasada la fase de selección de frases, expresiones y vocabulario, ahora estoy con la "extraña" tarea de categorizar el vocabulario. Si bien la clasificación de frases con verbos es sencilla porque desde un principio tenía claro que se podían clasificar por verbo "característico" y luego alfabéticamente; en cuanto al vocabulario, la única forma sencilla, y no siempre práctica, es ordenarlo alfabéticamente como en un diccionario. Sin embargo, quería una clasificación previa para hacerlo un poco más práctico. Hay infinitas maneras de clasificar las palabras. La cuestión está en elegir una forma de clasificar que no exija cientos de categorías, pero que no sean tan específicas que la mayoría de las palabras caigan en la categoría "otros", ni tan generales que acumulen cientos de palabras.

Y, por cierto, ¿Cómo va el banco de frases?:

Si va según lo previsto tendrá entre 7500 y 8500 líneas y estará disponible entre el 15 de Febrero y el 15 de Junio.

En próximas entradas os comentaré con más detalle el trabajo realizado, el que queda por hacer, e iré afinando un poco más la fecha de publicación.

Quiero Aprender Rumano

lunes, 11 de enero de 2016

Noticias sobre el futuro Banco de Frases



No quería lanzar una previsión de cómo sería el futuro Banco de frases y cuando saldrá publicado hasta no haber trabajado en la unificación de las bases de datos. En un principio mi objetivo era tener más de 4000 frases y que estuviera publicado durante el primer semestre de 2016.
Recordemos que el actual Banco de frases tiene unas 2000 líneas y fue publicado en 2012.
La primera previsión antes de comenzar con la unificación de archivos era de entre 2001 y 13500 líneas y que estaría publicado entre el 28 de Enero y el 8 de Agosto, es decir que no podía precisar nada, y por eso no había comentado nada.
Una vez unificados todos los archivos donde tengo guardadas las frases y tras un primer repaso para eliminar frases repetidas y algunas frases mal escritas, la previsión es que tenga entre 6000 y 8500 líneas, entre frases, expresiones y vocabulario básico, de las que aproximadamente unas 6000 serán frases completas con verbos. Eso significa triplicar al menos el tamaño del Banco de frases.
En cuanto a la fecha de publicación oscila entre el 30 de Enero y el 30 de Junio. Lamento no ser más preciso, pero la experiencia de dar fechas cerradas y publicadas y que luego no se cumplan es bastante común.
La próxima previsión en cuanto haya hecho una primera revisión de las erratas.


Quiero Aprender Rumano

domingo, 3 de enero de 2016

Una pausa


Ahora que el método QAR ha llegado al tema 50, es el momento de centrar los esfuerzos en otros documentos igualmente útiles pero que llevan tiempo abandonados. Desde ahora en adelante voy a centrarme en ampliar y editar el nuevo Banco de Frases.
El Banco de Frases actual contiene unas 2000 frases y está hecho en 2012. Quiero que el próximo contenga al menos 4000 frases y se edite en el primer semestre de este año 2016. Lo que sería el complemento ideal a las más de 3500 frases que contiene actualmente el método QAR. En las próximas entradas os iré informando de cómo va la construcción del nuevo Banco de Frases. Las nuevas frases ya están registradas en bases de datos, pero queda aún mucho trabajo de clasificación, orden y edición.

Quiero Aprender Rumano

sábado, 2 de enero de 2016

QAR llega al tema 50 con su nueva versión recién publicada


Ya está disponible en los enlaces habituales la nueva versión de QAR que abarca desde el tema 1 hasta el recién estrenado tema 50. Son unos 8 años de trabajo condensados en este documento que espero que continúe ayudando a la gente a aprender de una forma más fácil el rumano.
Los enlaces están arriba a la izquierda donde pone "material actualizado". Disponible en OneDrive, Drive y Scribd.

Quiero Aprender Rumano

viernes, 1 de enero de 2016

Un Arco Iris sobre el huerto y solución al acertijo anterior

Una de las películas de Barbie que tenía mi hija comenzaba: Dincolo de curcubeu..., a mí curcubeu a lo único que me sonaba era a cucurbitácea. De hecho prometo que escuché cucurbeu en vez de curcubeu con la "r" cambiada de sitio. Y yo preguntándome qué tenía que ver una cucurbitácea, es decir, una calabaza, un melón, o una sandía, en una película de hadas. Dincolo significa más allá. Así que más allá de eso se encuentra el paisaje donde se desarrollaba la película de hadas de Barbie.
¿Cómo se dice calabaza en rumano?
¿Y qué significa Curcubeu? No voy a prolongar más el enigma porque en estos tiempos cualquiera puede consultar un diccionario:

Calabaza se dice:
Dovleac
Curcubeu significa Arco Iris
Dincolo de curcubeu... Más allá del arco iris




Solución al acertijo anterior:


 Flauta en rumano es Flaut. Fluture significa mariposa, por eso todos estaban pendientes de la "Fluture" que ilustra la imagen.

Quiero Aprender Rumano