Revista Iberoamericana de Tecnologías del/da Aprendizaje/Aprendizagem (Latin-American Learning Technologies Journal) Una publicación de la Sociedad de la Educación del IEEE Uma publicação da Sociedade de Educação do IEEE A publication of the IEEE Education Society AGO. 2012

VOL. 7

NÚMERO/NUMBER 3

(ISSN 1932-8540)

Editorial (en español) ……………………………………...…………………....………. Pilar Molina Editorial (en português) …………………………………………………………………. Pilar Molina

i iv

Predicción del Fracaso Escolar Mediante Técnicas de Minería de Datos……………………………. ………………………………………………..………….. C. Márquez-Vera , C. Romero , S. Ventura

109

EDICIÓN ESPECIAL: ISELEAR Editores Invitados: Antonio Sarasa Cabezuelo y José Luis Sierra Rodríguez Editorial Especial: Sección Especial sobre Ingeniería del Software en eLearning……………………. ……………………………………………………Antonio Sarasa Cabezuelo y José Luis Sierra Rodríguez

119

Cole-Programming: IncorporandoSoporte al Aprendizaje Colaborativo en Eclipse ………………… …………………..…………… Francisco Jurado, Ana I. Molina, Miguel A. Redondo, Manuel Ortega

121

EDICIÓN ESPECIAL: AVANCES RECIENTES EN TECNOLOGÍAS DE E-LEARNING. RETOS Y OPORTUNIDADES Editores Invitados: Carmen Fernández Panadero, Gregorio Robles, Pilar Sancho Editorial Especial: Avances recientes en tecnologías de e-learning. Retos y oportunidades………..… .............................................................Carmen Fernández Panadero, Gregorio Robles, Pilar Sancho

131

Sistema tutor para la conducción eficiente de vehículos de combustión Superior…………….……… ………………………………………………………………...………. Abel Rionda, David Martínez, Xabiel G. Pañeda, Senior Member, IEEE, David Arbesú, J. Emilio Jimenez, F. F. Linera 133 (Continua en la Contraportada)

IEEE-RITA (http://webs.uvigo.es/cesei/RITA) CONSEJO/CONSELHO EDITORIAL Presidente (Editor Jefe): Martín Llamas Nistal, Universidad de Vigo, España Vicepresidente (Coeditor): Manuel Castro Gil, UNED, España Editor Asociado para lengua Portuguesa: Carlos Vaz do Carvalho, INESP, Portugal

Miembros: Melany M. Ciampi, COPEC, Brasil Javier Quezada Andrade, ITESM, México Edmundo Tovar, UPM, España Manuel Caeiro Rodríguez, Universidad de Vigo, España

Juan M. Santos Gago, Universidad de Vigo, España Secretaría: Pedro Pimenta, Universidade do Minho, Portugal Francisco Mur, UNED, España

COMITÉ CIENTÍFICO Alfredo Fernández Valmayor, Universidad Complutense de Madrid, España Antonio J. López Martín, Universidad Estatal de Nuevo Méjico, USA Antonio J. Méndez, Universidad de Coimbra, Portugal António Vieira de Castro, ISEP, Oporto, Portugal Arturo Molina, ITESM, México Baltasar Fernández, Universidad Complutense de Madrid, España Carlos Delgado, Universidad Carlos III de Madrid, España Carlos M. Tobar Toledo, PUC-Campinas, Brasil Claudio da Rocha Brito, COPEC, Brasil Daniel Burgos, ATOS Origin, España Fernando Pescador, UPM, España Francisco Arcega, Universidad de Zaragoza, España Francisco Azcondo, Universidad de Cantabria, España Francisco Jurado, Universidad de Jaen, España

Gustavo Rossi, Universidad Nacional de la Plata, Argentina Héctor Morelos, ITESM, México Hugo E. Hernández Figueroa, Universidad de Campinas, Brasil Ignacio Aedo, Universidad Carlos III de Madrid, España Inmaculada Plaza, Universidad de Zaragoza, España Jaime Muñoz Arteaga, Universidad Autónoma de Aguascalientes, México Jaime Sánchez, Universidad de Chile, Chile Javier Pulido, ITESM, México J. Ángel Velázquez Iturbide, Universidad Rey Juan Carlos, Madrid, España José Bravo, Universidad de Castilla La Mancha, España José Carpio, UNED, España José Palazzo M. De Oliveira, UFGRS, Brasil José Salvado, Instituto Politécnico de Castelo Branco, Portugal José Valdeni de Lima, UFGRS, Brasil

DOI (Digital Object Identifier) Pendiente

Juan Quemada, UPM, España Juan Carlos Burguillo Rial, Universidad de Vigo, España J. Fernando Naveda Villanueva, Universidad de Minnesota, USA Luca Botturi, Universidad de Lugano, Suiza Luis Anido, Universidad de Vigo, España Luis Jaime Neri Vitela, ITESM, México Manuel Fernández Iglesias, Universidad de Vigo, España Manuel Lama Penín, Universidad de Santiago de Compostela, España Manuel Ortega, Universidad de Castilla La Mancha, España M. Felisa Verdejo, UNED, España Maria José Patrício Marcelino, Universidad de Coimbra, Portugal Mateo Aboy, Instituto de Tecnología de Oregón, USA Miguel Angel Sicilia Urbán, Universidad de Alcalá, España Miguel Rodríguez Artacho, UNED, España

Óscar Martínez Bonastre, Universidad Miguel Hernández de Elche, España Paloma Díaz, Universidad Carlos III de Madrid, España Paulo Días, Universidade do Minho, Portugal Rocael Hernández, Universidad Galileo, Guatema Rosa M. Vicari, UFGRS, Brasil Regina Motz, Universidad de La República, Uruguay Samuel Cruz-Lara, Université Nancy 2, Francia Víctor H. Casanova, Universidad de Brasilia, Brasil Vitor Duarte Teodoro, Universidade Nova de Lisboa, Portugal Vladimir Zakharov, Universidade Estatal Técnica MADI, Moscú, Rusia Xabiel García pañeda, Universidad de Oviedo, España Yannis Dimitriadis, Universidad de Valladolid, España

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

i

La Importancia de la Motivación Pilar Molina Gaudó, SeniorMember, IEEE Presidenta de la Sección Española del IEEE Profesora en la Universidad de Zaragoza, España [email protected] “Possunt, quiapossevidentur” (La Eneida, Viirgilo) O lo que es lo mismo “Pueden los que creen poder”, frase bastante utilizada en inglés “They can, becausetheythinkthey can”. Redactar una editorial de la revista IEEERita en el medio del mes de agosto en nuestro país implica (generalmente) un esfuerzo de reflexión previo importante. Mes de vacaciones, playa o montaña ofrecen momentos de tranquilidad que ayudan en el proceso. Surgen cuestiones primordiales, tales cómo, ¿cuál es el origen del éxito formativo de un ingeniero? Los mejores ingenieros, los más técnicamente capaces y los grandes profesionales que he ido conociendo en mi trayectoria, ¿en qué son diferentes a los que no lo son tanto? La respuesta no es mía, ya Virgilio supo condensarla en la cita con la que comienzo. La motivación. Resulta obvio que una persona motivada adecuadamente, estudiante o ingeniero ejerciendo su profesión, llega mucho más lejos que alguien que termina haciendo algo que no le acaba de convencer profundamente. Podemos, y lo hacemos, generar los mejores currículos, trabajar con las mejores herramientas formativas, aportar innovaciones educativas brillantes tales como las que se pueden leer en esta revista. Necesitamos partir de que las

personas receptoras de éstas tengan la motivación adecuada, que estén dispuestos a luchar y a invertir tiempo y recursos en un reto personal que les ilusione, que les satisfaga, que les produzca alegría. Con este ingrediente básico el camino de la educación se allana. Sembrar en tierra auténticamente fértil. Sin pretender en absoluto hacer un análisis exhaustivo del asunto, simplemente aporto dos pinceladas en los dos temas siguientes. 1.- ESTUDIO DE LA MOTIVACIÓN Con el objetivo de verificar las diferencias de motivación entre sexos en España de cara a aumentar las vocaciones femeninas, llevamos a cabo varios estudios sociológicos en nuestra región (Aragón) entre estudiantes de los últimos cursos de educación obligatoria (3º y 4º de la ESO, es decir 15-16 años) acerca de su intencionalidad de estudiar ingeniería y por qué [1]. Estas encuestas se han realizado en varias ediciones durante varios años consecutivos. También, para tratar de arrojar algo más de luz en el asunto se han realizado otras encuestas a estudiantes matriculados en los primeros cursos de los grados de ingeniería que se imparten en uno de los campus de nuestra Universidad [2]. Sus resultados, al margen de su perspectiva de género y

ISSN 1932-8540 © IEEE

ii

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

Figura 1. Respuestas medias (entre 1-7 puntos) por género entre los estudiantes de 4º de la ESO (media de edad de 16 años) acerca de factores de motivación hacia las carreras de ingeniería. analizados en su totalidad son interesantes para esta comunidad y continúan en estudio. Las diferencias según la edad de los encuestados son significativas, siendo más acusadas en edades superiores a los 15 años. En edades inferiores los factores de motivación no aparecen de manera significativa y los resultados para estudiantes de 3º de la ESO resultan poco esclarecedores. La figura 1 muestra resultados para estudiantes preuniversitarios con un interés manifiesto para estudiar ingeniería respecto a su conocimiento de la profesión, percepción de la misma (varias preguntas que reflejaban la positiva percepción de la profesión tales como la facilidad de encontrar trabajo, el sueldo, la capacidad de compatibilización, etc.). Nótese que el valor más votado es siempre el factor de COOPERACIÓN, que no es otra cosa que una variable agregada que refleja los resultados de varias preguntas relacionadas con la visión de la ingeniería como una profesión que contribuye aque la humanidad mejore. También resulta significativo el aumento de vocaciones en el caso de tener referentes familiares cercanos que sean ingenieros o trabajen

en este entorno. El apoyo de la familia resulta crítico en este punto. En definitiva y como conclusión a los estudios que en este terreno hemos llevado a cabo y que comparto en estas líneas, resulta importante trabajar en la línea de mostrar que la ingeniería es una disciplina a través de la cual las condiciones de vida de las personas van a mejorar sustancialmente y de forma directa gracias al trabajo que una generación puede realizar. 2. – FOMENTO DE LA MOTIVACIÓN El IEEE tiene como lema principal “AdvancingTechnologyforHumankind”, frase que liga muy bien este apartado con el anterior. Una de las actividades que lleva a cabo el IEEE con empeño es la publicidad de las ingenierías y sus disciplinas a la comunidad preuniversitaria. Gran número de programas que en la Sección Española del IEEE, la que tengo el placer de representar como presidenta este año y el que viene, han arrancado recientemente para tratar de mejorar el conocimiento de nuestra disciplina, motivar a los estudiantes y por

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

iii

tanto mejorar el número (y sobre todo la calidad) de las vocaciones hacia nuestras titulaciones. A modo de muestra unas cuantas de ellas aparecen en [3], muchas de ellas organizadas por medio del modélico Capítulo de la Sociedad de Educación de la Sección Española. Sin ánimo de nombrarlas todas me gustaría destacar las actividades realizadas con el TISP (por sus siglas en inglés Teacher In ServiceProgram) y en colaboración con otras instituciones como la FundacióInstitució Catalana de Suport a la Recerca y con el Museo Nacional de Ciencia y Tecnología en A Coruña (MUNCYT). Desde estas líneas me gustaría agradecer la tarea de los voluntarios de estas acciones y hacer un llamamiento a todos aquellos que vean con interés el llegar a jóvenes a participar en cualquiera de ellas y colaborar. CONCLUSIÓN En cualquier caso, como conclusión me gustaría resaltar la importancia de la calidad en las vocaciones hacia la ingeniería y la mejora de la motivación por medio de la utilización de los muchos casos prácticos (que los hay en todas las disciplinas) que relacionan los avances tecnológicos con soluciones que claramente aportan calidad de vida y, como dice el lema central del IEEE, avanzan la tecnología al servicio de la humanidad. Si somos capaces de utilizar este tipo de contenidos en los ejemplos prácticos que mostremos en las herramientas docentes que desarrollamos en nuestra tarea como docentes es probable que el índice de motivación aumente unos puntitos, y por ende y según Virgilio, el de éxito también.

REFERENCIAS [1] Molina-Gaudo, P.; Baldassarri, S.; Villarroya-Gaudo, M.;Cerezo, E. "Perception and Intention in Relation to Engineering: A Gendered Study Based on a One-Day Outreach Activity," Education, IEEE Transactions on, vol.53, no.1, pp.61-70, Feb. 2010. [2] Laporta, E.“Diferencias de Género en la Elección de Estudios Técnicos en la Universidad de Zaragoza”. Memoria de Trabajo Fin de Máster Universitario en Relaciones de Género. Facultad de Ciencias Sociales y del Trabajo. Universidad de Zaragoza. Septiembre, 2011. [3] Web de la Sección Española del IEEE. http://www.ieeespain.com/, accedido el 15 de Agosto de 2012. Pilar Molina Gaudóes Doctora Ingeniera de Telecomunicación por la Universidad de Zaragoza en 2004. Estudió un curso de carrera en la Universidad Técnica de Munich, Alemania. Profesora de la Universidadde Zaragoza desde el año 2000. Sus tesis versó sobre los amplificadores de potencia de RF de alta eficiencia. Actualmente su investigación trata de convertidores e inversores de potencia de alta eficiencia utilizando dispositivos de carburo de silicio. Un ejemplo de aplicación en el que trabaja es la inducción doméstica. Pilar es voluntaria del IEEE desde el año 99 en diferentes posiciones. Tras haber sido dos veces vice-chair de la Región 8 (Europa, África y Oriente Próximo) del IEEE (de estudiantes y de actividades de miembros), actualmente es la Presidenta de la Sección Española del IEEE (años 2012-13). Adicionalmente, Pilar es la presidenta de MUCIT (Asociación Aragonesa de Mujeres Científicas y Técnicas). Fue miembro del comité del WIE (Women in Engineering) del IEEE desde 2001 al 2005. Actualmente participa activamente en la organización del Girls’ Day en Aragón en sus últimas cuatro ediciones, un evento que pretende mejorar, fomentar y diversificar las vocaciones en ingeniería. Su perfil ampliado está disponible en LinkedIn.

ISSN 1932-8540 © IEEE

iv

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

A importância da motivação Pilar Molina Gaudó, SeniorMember, IEEE Presidente da Secção Espanhola do IEEE Professora na Universidad de Zaragoza, Espanha [email protected] (Traduzido por Carlos Vaz de Carvalho) “Possunt, quia posse videntur” (Eneida, Virgilio)

este ingrediente básico o caminho da educação aplana-se. Trata-se verdadeiramentede semear terreno fértil.

Ou “Podem os que acreditam poder”, frase bastante utilizada em inglês “They can, becausetheythinkthey can”. Escrever um editorial da revista IEEERITA no meio de Agosto, no nosso país, implica (geralmente) um esforço de reflexão importante. Mês de férias, praia ou montanha oferecem momentos de tranquilidade que ajudam ao processo. As principais questões surgem, tais como, qual é a origem do sucesso da formação de um engenheiro? Em que são diferentes os melhores engenheiros, os profissionais mais tecnicamente capazes e dedicados que eu conheci na minha carreira? A resposta não é minha, e Virgílio soube condensá-lana citação anterior: Motivação. É óbvio que uma pessoa devidamente motivada, estudante ou engenheiro a fazer o seu trabalho, vai sempre muito além do que alguém que acaba por fazerpor fazer. Nós podemos criar os melhorescurricula, trabalhar com as melhores ferramentas de formação e fornecer brilhantes inovações educacionais como aquelas que podem ser lidas nesta revista. Precisamos que estas pessoas tenham a devida motivação, que que estejam dispostas a lutar e investir tempo e recursos num desafio pessoal que os excita, que os satisfaça e que lhesproduza alegria. Com

Sem qualquer pretensão de fazer uma análise aprofundada do caso, simplesmente forneçoduas pinceladas nos temas seguintes. 1.- ESTUDO DA MOTIVAÇÃO A fim de verificar as diferenças de motivação entre sexos na Espanha, tendo em vista o aumento das vocações femininas, realizamos vários estudos sociológicos na nossa região (Aragão) entre os estudantes nos anos finais do ensino obrigatório (3 º e 4 º do ESO, ou seja, 15-16 anos) sobre a sua intenção de estudar engenharia [1]. Essas pesquisas foram realizadas em várias edições,em vários anos consecutivos. Além disso, para tentar esclarecer um pouco mais este assunto outros estudos foram realizados com alunos matriculados nos primeiros anos dos cursos de engenharia ministrados num dos campi da nossa universidade [2]. Os seus resultados, independentemente da perspectiva de género, analisados na sua totalidade são interessantes para esta comunidade e continuam em estudo.Asdiferenças de acordo com a idade dos entrevistados são significativas, sendo mais pronunciadasnos maiores de 15 anos.

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

v

Figura 1. Média de respostas (entre 1-7 pontos) por sexo entre alunos de 4º ESO (idade média de 16 anos) sobre factores de motivação para carreiras de engenharia. Em idades mais jovens os factores motivacionais não são significativos e os resultados para os alunos de 3º de ESO não são muito esclarecedores. A Figura 1 mostra os resultados dos estudantes préuniversitários com interesse expresso para estudar engenharia relativamente ao conhecimento que têm da profissão, da percepção que têm da mesma (várias perguntas reflectiam a percepção positiva da profissão, como a facilidade de encontrar um emprego, o salário, a capacidade de compatibilização, etc.) Note-se que o item mais pontuado foi sempre o factor de cooperação, que nada mais é do que uma variável agregada que reflecte os resultados de várias questões relacionadas com a visão da engenharia como uma profissão que contribui para uma melhor humanidade. Também é significativo o aumento de vocações no caso de parentes próximos engenheiros ou que trabalhem neste ambiente. O apoio da família é crítico neste ponto. Em suma e como conclusão para os estudos realizados que eu compartilho nestas linhas, é importante trabalhar paramostrar que a engenharia é uma disciplina através da qual a vida das pessoas será melhorada

substancialmentepelo trabalho que uma geração pode fazer. 2. – FOMENTO DA MOTIVAÇÃO O IEEE tem como lema principal “AdvancingTechnology for Humankind”, frase que liga muito bem estasecção com a anterior. Uma das actividades desenvolvidas pelo IEEE é a publicidade da engenharia e das suas disciplinas no ensino secundário. Um grande número de programas da Secção Espanhola do IEEE, que tenho o prazer de representar como presidente este ano e no próximo, dirigemse a tentar melhorar o conhecimento da nossa disciplina, a motivar os alunos e, assim, melhorar o número (e, especialmente, a qualidade) de vocações para os nossos cursos. Uma amostra de alguns destes programas aparece em [3], sendo muitos deles organizados pelo exemplar Capítulo da Sociedade de Educação. Sem querer ser exaustiva, gostaria de destacar as actividades TISP (sigla em Inglês de Teacher in ServiceProgram) e a colaboração com outras instituições, como a Fundação Catalã de Apoio à Investigação e o Museu Nacional da Ciência e Tecnologia na Corunha (MUNCYT). A partir destas

ISSN 1932-8540 © IEEE

vi

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

linhas, gostaria de agradecer o trabalho dos voluntários destas acções e apelar a todos aqueles interessados em levar os jovens a participar em qualquer um destes programas. CONCLUSÃO Como conclusão, gostaria de destacar a importância da qualidade nas vocações para a engenharia e namelhoria da motivação através da utilização de vários casos práticos (que existem em todas as disciplinas) que relacionam os avanços tecnológicos com soluções que acrescentam qualidade de vida e, de acordo com o lema central do IEEE, avançam a tecnologia para a humanidade. Se formos capazes de utilizar estes conteúdos em exemplos práticos que mostrem aos professores as ferramentas que desenvolvemos no nosso trabalho é provável que aumentem os índices de motivação e, portanto, e como diz Virgílio, o sucesso também. REFERENCIAS [1] Molina-Gaudo, P.; Baldassarri, S.; Villarroya-Gaudo, M.;Cerezo, E. "Perception and Intention in Relation to Engineering: A Gendered Study Based on a One-Day Outreach Activity," Education, IEEE Transactions on, vol.53, no.1, pp.61-70, Feb. 2010.

[2] Laporta, E.“Diferencias de Género en la Elección de Estudios Técnicos en la Universidad de Zaragoza”. Trabalho de Final de Máster Universitario em Relações de Género. Faculdade de Ciências Sociais e do Trabalho. Universidade de Zaragoza. Setembro, 2011. [3] Web da Secção Espanhola do IEEE. http://www.ieeespain.com/, acedido a 15 de Agosto de 2012. Pilar Molina Gaudó é Doutora Engenheira Telecomunicações pela Universidade de Zaragoza em 2004. Estudou igualmente na Universidade Técnica de Munique, na Alemanha. Professora da Universidade de Zaragoza desde 2000. A sua tese abordou os amplificadores de potência de RF com alta eficiência. Actualmente a sua investigação versa os conversores de energia e conversores de alta eficiência usando dispositivos de carboneto de silício. Um exemplo de aplicação em que trabalha é a indução doméstica. Pilar é voluntária IEEE desde 99, em posições diferentes. Foi duas vezes vice-presidente da Região 8 (Europa, África e Oriente Médio) do IEEE (estudante e actividades de membros) e é atualmentea presidente da secção espanhola da IEEE (anos 2012-13). Além disso, Pilar é a presidente da MUCIT (Associação Aragonesa de Mulheres em Ciência e Tecnologia). Membro do comité WIE (Women in Engineering) do IEEE entre 2001 a 2005. Actualmente participa activamente na organização do GirlsDay emAragão, um evento que tem como objetivo melhorare diversificar as vocações de engenharia. O seu perfil alargado está disponível no LinkedIn.

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Nov. 2012

109

Predicción del Fracaso Escolar mediante Técnicas de Minería de Datos Carlos Márquez Vera1, Cristóbal Romero Morales2 \Sebastián Ventura Soto3. Title- Predicting of school failure using data mining techniques. Abstract- This paper proposes to apply data mining techniques to predict school failure and drop out. We use real data on 670 middle-school students from Zacatecas, México and employ white-box classification methods such as induction rules and decision trees. Experiments attempt to improve their accuracy for predicting which students might fail or drop out by: firstly, using all the available attributes; next, selecting the best attributes; and finally, rebalancing data, and using cost sensitive classification. The outcomes have been compared and the best resulting models are shown. Index Terms— School failure, Drop out, Educational Data Mining, Prediction, Classification.

E

I. INTRODUCCIÓN

los últimos años ha surgido en muchos países una preocupación ante el problema del fracaso escolar y un creciente interés por determinar los múltiples factores que pueden influir en él [1]. La mayoría de los trabajos que intentan resolver este problema [2] están enfocados en determinar cuáles son los factores que más afectan al rendimiento de los estudiantes (abandono y fracaso) en los diferentes niveles educativos (educación básica, media y superior) mediante la utilización de la gran cantidad de información que los actuales equipos informáticos permiten almacenar en bases de datos. Todos estos datos constituyen una auténtica mina de oro de valiosa información sobre los estudiantes. El problema es que identificar y encontrar información útil y oculta en grandes bases de datos es una tarea difícil [3]. Una solución muy prometedora para alcanzar este objetivo es el uso de técnicas de extracción de conocimiento o minería de datos en educación, lo que ha dado lugar a la denominada minería de datos educativa (Educational Data Mining, EDM) [4]. Esta nueva área de investigación se ocupa del desarrollo de métodos para explorar los datos que se dan en el ámbito educativo, así como de la utilización de estos métodos para entender mejor a los estudiantes y los contextos en que ellos aprenden [5]. Las técnicas de EDM ya se han empleado con éxito para crear modelos de predicción del rendimiento de los estudiantes [6], obteniendo resultados prometedores que demuestran cómo determinadas características sociológicas, económicas y educativas de los alumnos pueden afectar en 1

N

Carlos Márquez Vera, es profesor de la Universidad Autónoma de Zacatecas, México. Jardín Juárez 147, 98000 (Teléfono: 4929229471, email:[email protected]) 2 Cristóbal Romero Morales es profesor de la Universidad de Córdoba, Campus de Rabanales, 14071 Córdoba, España (Teléfono: 34-957-212172; fax: 34-957-218630; email: [email protected]). 3 Sebastián Ventura Soto es profesor de la Universidad de Córdoba, Campus de Rabanales, 14071 Córdoba, España ([email protected]). DOI (Digital Object Identifier) Pendiente

el rendimiento académico [7]. Es importante también destacar que hasta la fecha la mayor parte de las investigaciones sobre minería de datos aplicada a los problemas de abandono y fracaso, se han aplicado, sobre todo, en el nivel de educación superior [8] y, en mayor medida en la modalidad de educación a distancia [9]. Por el contrario, se ha encontrado muy poca información sobre la aplicación en la educación básica o media, donde sólo se han realizado simples análisis de la información basados en métodos estadísticos [10]. Existen algunas diferencias y/o ventajas entre aplicar minería de datos con respecto a sólo utilizar modelos estadísticos [11]: - La minería de datos es más amplia ya que es un proceso completo formado por varias etapas y que incluye muchas técnicas, entre ellas, las estadísticas. Este proceso de descubrimiento de información está formado por las etapas de pre-procesado, la aplicación de técnicas de minería de datos (una de ellas puede ser estadística) y la evaluación e interpretación de los resultados. - En las técnicas estadísticas (análisis de datos) se suele utilizar como criterio de calidad la verosimilitud de los datos dado el modelo. En minería de datos suele utilizar un criterio más directo, por ejemplo, utilizando el porcentaje de datos bien clasificados. - En estadística la búsqueda se suele realizar mediante modelización basada en un algoritmo de ascenso de colinas (hill-climbing) en combinación con un test de hipótesis basado en razón de verosimilitud. En minería de datos se suele utilizar una búsqueda basada en meta-heurísticas. - La minería de datos está orientada a trabajar con cantidades muy grandes de datos (millones y billones de datos). En cambio la estadística no suele funcionar tan bien en bases de datos de tan gran tamaño y alta dimensionalidad. En este trabajo se propone la utilización de técnicas de minería de datos para detectar, cuáles son los factores que más influyen para que los estudiantes de enseñanza media o secundaria fracasen, es decir, suspendan o abandonen. Además se propone utilizar diferentes técnicas de minería de datos debido a que es un problema complejo, los datos suelen presentar una alta dimensionalidad (hay muchos factores que pueden influir) y suelen estar muy desbalanceados (la mayoría de los alumnos suelen aprobar y sólo una minoría suele fracasar). El objetivo final es detectar lo antes posible a los estudiantes que presenten esos factores para poder ofrecerles algún tipo de atención o ayuda para tratar de evitar y/o disminuir el fracaso escolar.

ISSN 1932-8540 © IEEE

110

IEEE-RITA Vol. 7, Núm. 3, Nov. 2012

-

penalizaciones para intentar corregir el problema del desbalanceo de los datos. Finalmente, los distintos algoritmos utilizados deben de ser evaluados y comparados para determinar cuáles obtienen los mejores resultados de clasificación. Interpretación de los resultados. En esta última etapa, se analizan los modelos que han obtenido los mejores resultados para utilizarlos en la detección del fracaso escolar. Para ello, se analizan los factores que aparecen en las reglas y/o árboles de decisión, los valores que presentan y como están relacionados con otros factores.

A continuación, se describe un caso de estudio realizado con datos obtenidos de alumnos reales para mostrar la utilidad del método propuesto. Fig. 1. Método utilizado para predicción del fracaso escolar.

Este artículo está organizado de la siguiente forma: En la siguiente sección se hace una descripción general del método que proponemos para predecir el fracaso escolar. En la sección III, se describen los datos que hemos utilizado para este trabajo y las fuentes de información de las cuales fueron extraídos. La sección IV explica las tareas de preprocesado de los datos que hemos realizado. La sección V describe las diferentes pruebas de minería de datos que hemos realizado y los resultados obtenidos de las mismas. En la sección VI se hace una interpretación de los resultados y finalmente en la sección VII, se describen las conclusiones del trabajo y las futuras líneas de investigación. II. MÉTODO El método que se propone en este artículo está basado en la utilización de técnicas de minería de datos (ver Figura 1) y se compone de los pasos típicos de un proceso de extracción de conocimiento. - Recopilación de datos. En esta etapa se recoge toda la información disponible de los estudiantes. Para ello primero se debe de seleccionar el conjunto de factores que pueden afectar y después se deben de recoger a partir de las diferentes fuentes de datos disponibles. Finalmente toda esta información se debe integrar en un único conjunto de datos. - Pre-procesado. En esta etapa se preparan los datos para poder aplicar, posteriormente, las técnicas de minería de datos. Para ello, primero se realizan tareas típicas de pre-procesado como: limpieza de datos, transformación de variables y particionado de datos. Además se han aplicado otras técnicas como la selección de atributos y el re-balanceado de datos para intentar solucionar los problemas de la alta dimensionalidad y desbalanceo que presentan normalmente este tipo de conjuntos de datos. - Minería de datos. En esta etapa se aplican algoritmos de minería de datos para predecir el fracaso escolar como si fuera un problema de clasificación. Para ello, se propone utilizar algoritmos de clasificación basada en reglas y en árboles de decisión debido a que son técnicas de “caja blanca” que generan modelos altamente interpretables que permiten su utilización directa en procesos de toma de decisiones. Además de la clasificación tradicional se propone utilizar también clasificación basada en costos o

III. RECOPILACIÓN DE DATOS El fracaso escolar es conocido como “el problema de las mil causas” [12] debido a la gran cantidad posible de causas o factores de tipo personal, académicas, físicas, económicas, familiares, sociales, institucionales, pedagógicas, etc., que pueden tener influencia en el fracaso o abandono de los estudiantes. En nuestro caso de estudio concreto, los datos que hemos utilizado son de estudiantes del Programa II de la Unidad Académica Preparatoria de la Universidad Autónoma de Zacatecas (UAPUAZ) de México. Todos los estudiantes que han participado en este estudio eran de nuevo ingreso en el curso académico 2009-2010 en el nivel medio-superior de educación Mexicana. Toda la información se recopiló de tres fuentes diferentes: a) De una encuesta que se les aplicó a todos los alumnos a mitad del curso, con la finalidad de obtener información para detectar factores importantes que pueden incidir en su rendimiento escolar. b) Del Centro Nacional de Evaluación (CENEVAL). Organismo que, entre otras actividades, realiza exámenes de ingreso o admisión en muchas instituciones de educación media y superior. Cuando los estudiantes se inscriben al examen, también se les hace un estudio socioeconómico, de éste se extrajo parte de la información. c) Del Departamento de Servicios Escolares del Programa II, donde se recogen todas las notas obtenidas por los estudiantes. A continuación, en la Tabla I, se muestran todas las variables agrupadas en las tres fuentes de datos que hemos utilizado. IV. PRE-PROCESADO DE DATOS Antes de aplicar un algoritmo de minería de datos, generalmente hay que realizar algunas tareas de preprocesado, que permitan transformar los datos originales a una forma más adecuada para ser usada por el algoritmo en particular. En nuestro caso de estudio estas tareas han consistido en la integración, la limpieza, la transformación y la discretización de datos [13]. La integración de los datos consiste en agrupar toda la información disponible de cada estudiante de las tres fuentes de datos en un único fichero de datos:

ISSN 1932-8540 © IEEE

MÁRQUEZ, ROMERO Y VENTURA: PREDICCIÓN DEL FRACASO ESCOLAR MEDIANTE TÉCNICAS... TABLA I VARIABLES UTILIZADAS Y FUENTE DE PROCEDENCIA Fuente

Variable

Encuesta

Semestre y grupo, Turno, Nivel de motivación, Sanción administrativa, No. de amigos, Tiempo de estudio adicional, Forma de estudio, Lugar de estudio, Cuándo estudia, Dudas, E. Civil, Si tiene hijos, Religión, Carrera universitaria electa, Influencia en decisión de carrera universitaria, Personalidad, Discapacidad física, Enfermedad grave, Bebidas alcohólicas, Si fuman, Nivel económico, Recursos para estudiar, Beca, Trabajo, Con quién vive, Nivel educativo de la madre, Nivel educativo del padre, No. de hermanos, Orden de nacimiento, Espacio para estudiar, Estímulo de los padres, Habitantes en comunidad, Años viviendo en comunidad, Modo de transporte, Distancia a la escuela, Asistencia a clases, se aburre en clase, Considera los conocimientos útiles, Asignatura difícil, Toma apuntes, Exceso de tarea, No. De alumnos en grupo, Forma de enseñar, Infraestructura escolar, Asesor, Interés de la institución.

CENEVAL

Edad, Sexo, Estado de procedencia, Régimen de escuela de procedencia, Modelo de secundaria, Promedio de secundaria, Trabajo de la madre, Trabajo del padre, No. de PC en familia, Limitado para ejercicio, Frecuencia de ejercicio, Tiempo de sesiones de ejercicio, Nota en Razonamiento Lógico Matemático, Nota en Matemáticas, Nota en Razonamiento Verbal, Nota en Español, Nota en Biología, Nota en Física, Nota en Química, Nota en Historia, Nota en Geografía, Nota en Formación Cívica, Nota en Ética, Nota en Inglés y calificación del EXANI I.

Departamento Escolar

Nota en Matemáticas 1, Nota en Física 1, Nota en Ciencias Sociales 1, Nota en Humanidades 1, Nota en Taller de Lectura y Redacción 1, Nota en Inglés 1, Nota en Computación 1, Estado Académico.

a)

Los datos de la encuesta en papel se pasaron a formato electrónico. b) Los datos del CENEVAL ya se encontraban en formato electrónico. c) Los datos del departamento escolar también se encontraban en formato electrónico. En la etapa de limpieza, se extrajo del conjunto de datos a aquellos estudiantes que no tenían completa al 100% toda la información. Es decir, que si durante el estudio socioeconómico que realizó el CENEVAL o durante la encuesta para detectar los factores que afectan el desempeño académico, algún estudiante omitió una o más respuestas, entonces éste se excluyó del conjunto de datos. En la etapa de transformación se modificaron algunos nombres de atributos e instancias que contenían la letra Ñ, porque el software de minería de datos utilizado cambia este caracter por otro símbolo poco usual. Además también se puso la edad en años de los estudiantes, debido a que la información proporcionada por el CENEVAL, contenía, día, mes y año de nacimiento. En la etapa de discretización, tanto las calificaciones o notas obtenidas en el examen de admisión EXANI I, el promedio en la secundaria y en las asignaturas cursadas durante el semestre, cambiaron de formato numérico (valores de 0 a 10) a formato nominal o categórico. Concretamente las etiquetas utilizadas y los rangos de discretización de las notas fueron: Excelente (9,5 a 10); Muy Bien (8,5 a 9,4); Bien (7,5 a 8,4); Regular (6,5 a 7,4); Suficiente (6,0 a 6,4); Deficiente (4,0 a 5,9); Muy Deficiente (menor a 4,0) y No presentó. Se creó un fichero con formato

111

.ARFF de Weka [14], que es el software de minería de datos elegido para realizar las pruebas. Después de realizar las anteriores tareas de pre-procesado, se dispone de un primer fichero de datos con 77 atributos/variables sobre 670 alumnos. Este fichero de datos fue particionado (10 particiones) para poder hacer una validación cruzada en las pruebas de clasificación. Una partición es la división aleatoria del fichero original de datos en otros dos, uno para la etapa de entrenamiento (training) y el otro para la etapa de prueba (test). Debido a la gran cantidad de atributos recopilados (77), se realizó también un análisis o estudio de selección de atributos para determinar cuáles son los que mayormente influyen en la variable de salida o clase a predecir (Estado Académico). Para seleccionar las variables de mayor relevancia se utilizaron varios métodos de selección de atributos disponibles en el software Weka. En general, estos algoritmos de selección pueden ser agrupados por varios criterios. Una categorización popular es aquella en la que los algoritmos se distinguen por su forma de evaluar atributos y se clasifican en: filtros, donde se seleccionan y evalúan los atributos en forma independiente del algoritmo de aprendizaje y wrappers (envoltorios), los cuales usan el desempeño de algún clasificador (algoritmo de aprendizaje) para determinar lo deseable de un subconjunto [15]. A continuación, en la Tabla II, se muestran los resultados obtenidos de la aplicación de 10 algoritmos de selección de mejores atributos sobre el fichero de datos. Para seleccionar los mejores atributos se revisaron los resultados obtenidos por los 10 algoritmos de selección y se contabilizaron los que han sido seleccionados por varios de ellos. En la Tabla III se muestra la frecuencia de aparición de cada atributo, de esta tabla seleccionamos solamente aquellos con frecuencia mayor de 2, es decir, los mejores atributos son los que al menos 2 algoritmos los han seleccionado. Al hacer la selección de los atributos con mayor frecuencia, se ha pasado de tener los 77 atributos originales a solamente los 15 mejores. Nuevamente, este fichero de datos se partió en 10 ficheros de entrenamiento y 10 ficheros de prueba. Finalmente, como ya se mencionó anteriormente, nuestro conjunto de datos está desbalanceado. Este problema ocurre cuando el número de instancias de una clase es mucho menor que el número de instancias de la otra clase (o de otras clases). En nuestro caso, de los 670 alumnos, 610 aprobaron y 60 suspendieron o abandonaron. Por lo que se considera que los datos están desbalanceados, es decir, hay una mayoría de alumnos que aprobaron frente a una minoría que suspendieron. El problema de utilizar datos desbalanceados es que los típicos algoritmos de clasificación han sido desarrollados para maximizar la tasa de exactitud total, lo cual es independiente de la distribución de clases, esto provoca que los clasificadores tengan en la etapa de entrenamiento una clase mayoritaria lo que lleva a clasificar en la etapa de prueba con baja sensibilidad a los elementos de la clase minoritaria. Una manera de resolver el problema, es actuar en la etapa de pre-procesado de los datos, haciendo un sobre muestreo o balanceo de la distribución de clases, para ello existen varios algoritmos de re-balanceo y uno ampliamente usado es el denominado SMOTE (Synthetic Minority Oversampling Technique) disponible en Weka como un filtro de datos.

ISSN 1932-8540 © IEEE

112

IEEE-RITA Vol. 7, Núm. 3, Nov. 2012 TABLA II MEJORES ATRIBUTOS SELECCIONADOS

Algoritmo CfsSubsetEval

ChiSquaredAttributeEval. ConsistencySubsetEval Filtered-AttributeEval

FilteredSubsetEval GainRatioAttributeEval

InfoGainAttributeEval OneRAttributeEval ReliefFAttributeEval

SymmetricalUncertAttributeEval

Atributos Seleccionados Discapacidad física; Edad; Matemáticas 1; Física 1; Ciencias Sociales 1; Humanidades 1; Taller de Lectura y Redacción 1; Inglés 1; Computación 1. Humanidades 1; Inglés 1; Ciencias Sociales 1; Física 1; Matemáticas 1; Computación 1; Taller de Lectura y Redacción 1; Nivel de motivación. Semestre y grupo; Sesiones de ejercicio; Humanidades 1; Inglés 1, Dudas. Humanidades 1; Inglés 1; Matemáticas 1; Ciencias Sociales 1; Física 1; Taller de Lectura y Redacción 1; Computación 1; Nivel de motivación; Promedio de secundaria; Historia; Semestre y grupo; Calificación de EXANI I. Matemáticas 1; Física 1; Ciencias Sociales 1; Humanidades 1; Taller de Lectura y Redacción 1; Inglés 1; Computación 1. Matemáticas 1; Humanidades 1; Inglés 1; Ciencias Sociales 1; Física 1; Taller de Lectura y Redacción 1; Computación 1; Nivel de motivación; Estado civil; Discapacidad física; Promedio de secundaria; Fumas. Humanidades 1; Inglés 1; Matemáticas 1; Ciencias Sociales 1; Física 1; Taller de Lectura y Redacción 1; Computación 1. Humanidades 1; Ciencias Sociales 1; Inglés 1; Computación 1; Taller de Lectura y Redacción 1; Matemáticas 1; Física 1; Nivel de motivación. Física 1; Inglés 1; Matemáticas 1; Humanidades 1; Taller de Lectura y Redacción 1; Ciencias Sociales 1; Promedio de secundaria; Computación 1; Nivel de motivación; Edad; Calificación de EXANI I; Fumas. Humanidades 1; Matemáticas 1; Inglés 1; Ciencias Sociales 1; Física 1; Taller de Lectura y Redacción 1; Computación 1.

En términos generales, SMOTE introduce de manera sintética elementos de la clase minoritaria para equilibrar la muestra de datos, basado en la regla del vecino más cercano. Los elementos sintéticos creados son introducidos en el espacio que hay entre los elementos de la clase minoritaria. Dependiendo del tamaño del sobre muestreo requerido los vecinos más cercanos son elegidos aleatoriamente [16]. En nuestro caso el conjunto de datos con los 15 mejores atributos y con 670 instancias fue particionado de la siguiente manera: cada fichero de entrenamiento se rebalanceó con el algoritmo SMOTE de forma que tuviera el 50% de instancias Aprobó y el 50% de instancias Suspendió, dejando los ficheros de prueba sin re-balancear. Después de realizar todas las tareas de pre-procesado de datos, se cuenta con: - 10 ficheros de entrenamiento y testeo con todos los atributos (77 atributos). - 10 ficheros de entrenamiento y testeo con sólo los 15 mejores atributos. - 10 ficheros de entrenamiento y testeo con sólo los 15 mejores atributos, donde los ficheros de entrenamiento están re-balanceados. V. MINERÍA DE DATOS Y EXPERIMENTACIÓN En esta sección se describen los experimentos realizados y las técnicas de minería de datos utilizadas para la obtención de modelos de predicción del Estado Académico de los estudiantes al final del semestre.

TABLA III ATRIBUTOS DE MAYOR INFLUENCIA ORDENADOS SEGÚN LA FRECUENCIA DE APARICIÓN EN LOS MÉTODOS DE SELECCIÓN DE ATRIBUTOS Atributo Humanidades 1 Inglés 1 Ciencias Sociales 1 Matemáticas 1 Taller de Lectura y Redacción 1 Física 1 Computación 1 Nivel de motivación Promedio de secundaria Fumas Calificación de EXANI I Edad Discapacidad física Semestre y grupo

Frecuencia 10 10 9 9 9 9 9 5 3 2 2 2 2 2

Concretamente, hemos realizado varios experimentos con el objetivo de obtener la máxima exactitud de clasificación. En un primer experimento hemos ejecutado 10 algoritmos de clasificación utilizando todos los atributos con los que se cuenta, es decir de toda la información disponible. En un segundo experimento, utilizamos sólo los mejores atributos o variables. En un tercer experimento, hemos repetido las ejecuciones pero utilizando los ficheros de datos rebalanceados. En un último experimento hemos consideramos diferentes costos de clasificación. Hemos seleccionado 10 algoritmos de clasificación de entre los disponibles por la herramienta de minería de datos Weka. Esta selección se ha realizado debido a que estos algoritmos, son todos del tipo “caja blanca”, es decir, se obtiene un modelo de salida comprensible para el usuario, porque o se obtienen reglas de clasificación del tipo “Si – Entonces” o árboles de decisión. De esta forma un usuario no experto en minería de datos como un profesor o instructor puede utilizar directamente la salida obtenida por estos algoritmos para detectar a los alumnos con problemas a tiempo y poder tomar decisiones sobre cómo ayudarlos y evitar que suspendan o abandonen. Las reglas de clasificación del tipo “Si – Entonces” son una manera simple y fácilmente comprensible de representar el conocimiento. Una regla tiene dos partes, el antecedente y el consecuente. El antecedente de la regla (la parte del “Si”) contiene una combinación de condiciones respecto a los atributos de predicción. El consecuente de la regla (la parte del “Entonces”) contiene el valor predicho para la clase. De esta manera, una regla asigna una instancia de datos a la clase señalada por el consecuente si los valores de los atributos de predicción satisfacen las condiciones expresadas en el antecedente, y por tanto, un clasificador es representado como un conjunto de reglas. Los algoritmos incluidos en este paradigma pueden ser considerados como una búsqueda heurística en un espacio de estados. En este caso, un estado corresponde a una regla candidata, y los operadores corresponden a la generalización y especialización de operaciones que transformen una regla candidata en otra. Los 5 algoritmos de inducción de reglas de clasificación que se usaron son: JRip, NNge, OneR, Prism [17] y Ridor.

ISSN 1932-8540 © IEEE

MÁRQUEZ, ROMERO Y VENTURA: PREDICCIÓN DEL FRACASO ESCOLAR MEDIANTE TÉCNICAS... Un árbol de decisión es un conjunto de condiciones organizadas en una estructura jerárquica, el cual contiene cero o más nodos internos y uno o más nodos de hoja. Los nodos internos tienen dos o más nodos secundarios y contienen divisiones, los cuales prueban el valor de una expresión de los atributos. Los arcos de un nodo interno a otro secundario (o de menor jerarquía) son etiquetados con distintas salidas de la prueba del nodo interno. Cada nodo hoja tiene una etiqueta de clase asociada. El árbol de decisión es un modelo predictivo en el cual una instancia es clasificada siguiendo el camino de condiciones cumplidas desde la raíz hasta llegar a una hoja, la cual corresponderá a una clase etiquetada. Un árbol de decisión se puede convertir fácilmente en un conjunto de reglas de clasificación [18]. Los 5 algoritmos de árboles de decisión que se utilizarán son J48 [18], SimpleCart [19], ADTree [20], RandomTree y REPTree. En el primer experimento, se han ejecutado los 10 algoritmos utilizando toda la información disponible, es decir, los ficheros de datos con los 77 atributos de los 670 alumnos. Hemos realizado una validación cruzada con 10 particiones. En este tipo de validación cruzada, se realiza el entrenamiento y el testeo diez veces con las diferentes particiones. Los resultados obtenidos (la media de las 10 ejecuciones) con los ficheros de prueba/test de la aplicación de los algoritmos de clasificación se muestran en la Tabla IV. Se ha indicado además del porcentaje de exactitud global o total, también los porcentajes para cada uno de los dos valores de la clase (Aprobó y Suspendió/Abandonó) y una medida de tendencia central bastante empleada para casos similares a éste de datos desbalanceados, la media geométrica. Puede observarse en la Tabla IV que los porcentajes de exactitud obtenidos para la exactitud total y para los Aprobados son altos, no así para los que suspendieron y la media geométrica. Concretamente, los algoritmos que obtienen los valores máximos son: JRip (en el ratio de Suspendió/Abandonó y media geométrica), y ADTree (en el ratio de Suspendió/abandonó y exactitud). En el segundo experimento, se han utilizado los ficheros con los mejores 15 atributos, que consiste en ejecutar nuevamente los 10 algoritmos de clasificación para poder comprobar cómo ha afectado la selección de atributos en la predicción. La Tabla V muestra los resultados de la validación cruzada (la media de las 10 ejecuciones) de los algoritmos de clasificación utilizando solamente los 15 mejores atributos. Al comparar las Tablas IV y V se puede observar que los algoritmos han mejorado el porcentaje de exactitud al utilizar sólo los mejores atributos. Aunque hay algunos algoritmos que empeoran un poco, en general la tendencia es de mejora. De hecho, se obtienen unos valores máximos mejores a los obtenidos con todos los atributos. Nuevamente los algoritmos que obtienen estos valores máximos son el JRip (ratio Suspendió y media geométrica) y ADTree (ratio Aprobó y exactitud total). A pesar de haber obtenido mejores resultados, todavía no se obtiene una buena clasificación de la clase minoritaria Suspendió/Abandonó, obteniendo como valor máximo sólo un 81,7% de acierto frente al 99,2% de acierto de la clase mayoritaria Aprobó. Esto puede ser debido a que los datos se encuentran muy desbalanceados. Esta característica de los datos es un hecho poco deseable y puede afectar negativamente en los resultados obtenidos al aplicar los

113

TABLA IV VALIDACIÓN CRUZADA UTILIZANDO LOS 77 ATRIBUTOS DISPONIBLES Algoritmo JRip NNge OneR Prism Ridor ADTree J48 RandomTree REPTree SimpleCart

%Aciertos Aprobó 97,7 98,5 98,9 99,5 96,6 99,7 97,4 95,7 98,0 97,7

%Aciertos Suspendió 78,3 73,3 41,7 25,0 65,0 76,7 53,3 48,3 56,7 65,0

%Exactitud Total 96,0 96,3 93,7 93,1 93,7 97,6 93,4 91,5 94,3 94,8

Media Geométrica 87,5 85,0 64,2 49,9 79,2 87,4 72,1 68,0 74,5 79,7

TABLA V VALIDACIÓN CRUZADA UTILIZANDO LOS 15 ATRIBUTOS SELECCIONADOS COMO MEJORES Media %Aciertos %Aciertos %Exactitud Algoritmo Geométric Aprobó Suspendió Total a 97,0 95,7 JRip 81,7 89,0 98,0 76,7 96,1 86,7 NNge 98,9 41,7 93,7 64,2 OneR 99,2 44,2 94,7 66,2 Prism 95,6 68,3 93,1 80,8 Ridor 78,3 88,1 99,2 97,3 ADTree 97,7 55,5 93,9 73,6 J48 98,0 63,3 94,9 78,8 RandomTree 97,9 60,0 94,5 76,6 REPTree 98,0 65,0 95,1 79,8 SimpleCart

algoritmos de clasificación, y es debido a que los algoritmos suelen centrarse en clasificar a los individuos de la clase mayoritaria para obtener un buen porcentaje de clasificación total y olvidar a los individuos de la clase minoritaria. En el tercer experimento, se ha intentado solucionar o mitigar este problema del desbalanceo de los datos. Para ello, se han vuelto a utilizar los ficheros con los mejores 15 atributos, pero ahora los ficheros de entrenamiento han sido previamente re-balanceados con el algoritmo SMOTE. La tabla VI muestra los resultados de esta tercera prueba realizada. Al analizar esta tabla y compararla con los anteriores resultados de las Tablas IV y V se observa que la mayoría de los algoritmos han aumentado su exactitud en predicción, obteniendo nuevos valores máximos en casi todas las medidas excepto en el porcentaje de exactitud total. En este caso, los algoritmos que han obtenido los mejores resultados han sido el algoritmo Prism, OneR y nuevamente el algoritmo ADTree. Finalmente, otra forma distinta de abordar el problema de la clasificación de datos desbalanceados es realizar una clasificación sensible al costo. En la clasificación tradicional no se distingue si una de las clases a clasificar es más importante que otra, es decir, si una tiene un costo de clasificación diferente. Optimizar la tasa de clasificación sin tomar en cuenta el costo de los errores a menudo puede conducir a resultados no óptimos debido al alto costo que puede ocasionar la mala clasificación de una instancia minoritaria. De hecho, en nuestro problema en particular, estamos mucho más interesados en la clasificación de los alumnos de la clase Suspendió/Abandonó (clase minoritaria). Estos costos pueden ser incorporados al

ISSN 1932-8540 © IEEE

114

IEEE-RITA Vol. 7, Núm. 3, Nov. 2012

algoritmo de forma que se puedan tener en cuenta durante la clasificación. Por ejemplo, si se tiene dos clases, los dos tipos de errores, Falsos Positivos y Falsos Negativos pueden tener diferente costo; o por el contrario, los dos tipos de clasificación correcta pueden tener diferentes beneficios. Los costos se pueden plasmar en una matriz de 2x2 en la cual los elementos de la diagonal principal representan los dos tipos de clasificación correcta y los elementos fuera de la diagonal representan los dos tipos de errores. La matriz de costos predeterminada (utilizada por todos los algoritmos de clasificación tradicional) en la que los costos de los errores son iguales sería: [0, 1; 1, 0], donde la diagonal principal (valores correctos) tienen ceros y en el resto (valores incorrectos) tiene unos, indicando que tienen igual costo o beneficio. En cambio si los costos de alguna de las clasificaciones erróneas o bien de alguno de los beneficios de las correctas son diferentes, se indicaría con un valor distinto a uno. El software Weka permite realizar clasificación teniendo en cuenta el costo, para lo cual se utiliza el clasificador CostSensitiveClassifier y al cual se le asocia tanto la matriz de costo como el algoritmo clasificador a utilizar. Después de hacer varias pruebas con diferentes costos, se encontró que utilizando la matriz [0, 1; 4, 0], se obtuvieron los mejores resultados de clasificación, lo cual indica que al realizar la clasificación se tiene en cuenta que es 4 veces más importante clasificar de manera correcta los casos de Suspendió/Abandonó que los casos de Aprobó. Finalmente, el cuarto y último experimento consistió en ejecutar los diez algoritmos de clasificación utilizando costos y los ficheros con los mejores 15 atributos. La Tabla VII muestra los resultados obtenidos. Al comparar los resultados obtenidos en la Tabla VII con respecto a la Tabla VI, se observa que aunque ha empeorado un poco el porcentaje de aciertos de Aprobó y la exactitud total, por el contrario ha aumentado (obteniendo los valores máximos con respecto a todos los anteriores experimentos) tanto la media geométrica como el porcentaje de aciertos de Suspendió/Abandonó que es justamente lo que más nos interesa en este trabajo (detectar a los alumnos en riesgo). En este caso, los algoritmos que mejores resultados obtuvieron fueron Prism, JRip, ADTree y SimpleCart.

TABLA VI VALIDACIÓN CRUZADA UTILIZANDO LOS 15 MEJORES ATRIBUTOS Y PREVIAMENTE BALANCEANDO LOS DATOS DE ENTRENAMIENTO CON EL ALGORITMO SMOTE Algoritmo JRip NNge OneR Prism Ridor ADTree J48 RandomTree REPTree SimpleCart

%Aciertos Aprobó 97,7 98,7 88,8 99,8 97,9 98,2 96,7 96,1 96,5 96,4

%Aciertos Suspendió 65,0 78,3 88,3 37,1 70,0 86,7 75,0 68,3 75,0 76,7

%Exactitud Total 94,8 96,9 88,8 94,7 95,4 97,2 94,8 93,6 94,6 94,6

Media Geométrica 78,8 87,1 88,3 59,0 81,4 92,1 84,8 79,6 84,6 85,5

TABLA VII VALIDACIÓN CRUZADA UTILIZANDO LOS 15 MEJORES ATRIBUTOS Y CONSIDERANDO EL COSTO DE CLASIFICACIÓN Algoritmo JRip NNge OneR Prism Ridor ADTree J48 RandomTree REPTree SimpleCart

%Aciertos Aprobó 96,2 98,2 96,1 99,5 96,9 98,1 95,7 96,6 95,4 97,2

%Aciertos Suspendió 93,3 71,7 70,0 39,7 58,3 81,7 80,0 68,3 65,0 90,5

%Exactitud Total 96,0 95,8 93,7 94,4 93,4 96,6 94,3 94,0 92,7 96,6

Media Geométrica 94,6 83,0 80,5 54,0 74,0 89,0 87,1 80,4 78,1 93,6

VI. INTERPRETACIÓN DE RESULTADOS En esta sección se van a mostrar y comentar algunos de los modelos de reglas o árboles de clasificación que han sido generados por los algoritmos que mejores resultados de clasificación han obtenido en la anterior etapa de experimentación: JRip (ver Tabla VIII), ADTree (ver Tabla IX), Prism (ver Tabla X) y SimpleCart (ver Tabla XI). En las reglas de la Tabla VIII se observa en general que el algoritmo JRip descubre pocas reglas. Con respecto a los atributos que aparecen asociados a suspender son mayoritariamente referentes a notas, indicando que el alumno suspendió Física o que no se presentó a Humanidades, Matemáticas, Inglés o Taller de Lectura y Redacción. También aparecen otros atributos que indican que los alumnos que suspenden tienen una edad superior a 15 años o que pertenece a un determinado grupo (1M). En el árbol de decisión de la Tabla IX se observa que sólo aparecen atributos de tipo nota con valores de no presentado, deficiente o regular. Se observa además que asignaturas como Humanidades y Ciencias Sociales, asignaturas relativamente sencillas de aprobar, aparecen en la parte alta del árbol. En las reglas de la Tabla X se observa en general que el algoritmo Prism descubre una gran cantidad de reglas. Además, se observa que además de los atributos de tipo nota (con valores de no presentado o deficiente) aparece el atributo que indica que el alumno pertenece a un grupo en particular (1R, 1G, 1M o 1E). El árbol de clasificación de la Tabla XI se observa en general que es más pequeño que el obtenido por el ADTree. También se observa que además de los atributos de tipo nota (con valores de no presentado, deficiente o regular) en Humanidades, Matemáticas, Inglés o Computación, también aparecen otros atributos como son si el nivel de motivación del alumno es bajo o no y a que semestre y grupo en particular pertenece el alumno (1R, 1G, 1M). Finalmente, es importante reseñar que no se ha detectado un consenso entre los anteriores algoritmos de clasificación sobre la existencia de un único factor que más influya en el fracaso de los estudiantes. En cambio, si se pueden considerar el siguiente grupo de factores (que son los que más aparecen en los modelos obtenidos) como los más influyentes: Deficiente o No Presentado en Física 1, Deficiente o No Presentado en Matemáticas, No Presentado en Humanidades 1, Deficiente en Inglés 1, No Presentado en Taller de Lectura y Redacción, Deficiente en Ciencias Sociales, Edad de más de 15 años y Nivel de motivación regular.

ISSN 1932-8540 © IEEE

MÁRQUEZ, ROMERO Y VENTURA: PREDICCIÓN DEL FRACASO ESCOLAR MEDIANTE TÉCNICAS... TABLA VIII REGLAS OBTENIDAS USANDO JRip, LOS 15 MEJORES ATRIBUTOS Y CONSIDERANDO EL COSTO DE LA CLASIFICACIÓN (Física 1 = Deficiente) => Estado Académico = Suspendió (Humanidades 1 = No Presentado) => Estado Académico = Suspendió (Matemáticas 1 = No Presentado) => Estado Académico = Suspendió (Inglés 1 = Deficiente) and (Física 1 = No Presentado) => Estado Académico = Suspendió (Taller de Lectura y Redacción 1 = No Presentado) => Estado Académico = Suspendió (Ciencias Sociales 1 = Deficiente) and (Edad = más de 15) and (Semestre y Grupo = 1M) => Estado Académico = Suspendió => Estado Académico = Aprobó TABLA IX ÁRBOL OBTENIDO USANDO ADTree, LOS 15 MEJORES ATRIBUTOS Y CONSIDERANDO EL COSTO DE LA CLASIFICACIÓN : -0,465 | (1) Humanidades 1 = No Presentado: 1,824 | (1) Humanidades 1!= No Presentado: -0,412 | | (2) Física 1 = Deficiente: 1,415 | | (2) Física 1 != Deficiente: -0,632 | | | (9) Taller de Lectura y Redacción 1 = No Presentado: 1,224 | | | (9) Taller de Lectura y Redacción 1 != No Presentado: -0,52 | (3) Ciencias Sociales 1 = Deficiente: 1,689 | (3) Ciencias Sociales 1 != Deficiente: -0,245 | | (4) Inglés 1 = Deficiente: 1,278 | | (4) Inglés 1 != Deficiente: -0,322 | | | (5) Matemáticas 1 = No Presentado: 1,713 | | | (5) Matemáticas 1 != No Presentado: -0,674 | | | (6) Ciencias Sociales 1 = No Presentado: 1,418 | | | (6) Ciencias Sociales 1 != No Presentado: -0,283 | | | | (8) Inglés 1 = No Presentado: 1,313 | | | | (8) Inglés 1 != No Presentado: -0,695 | (7) Matemáticas 1 = Deficiente: 0,758 | | (10) Humanidades 1 = Regular: -0,473 | | (10) Humanidades 1 != Regular: 0,757 | (7) Matemáticas 1 != Deficiente: -0,315 Legend: -ve = Aprobó, +ve = Suspendió TABLA X REGLAS (DE TIPO SUSPENDIÓ) OBTENIDAS USANDO Prism, LOS 15 MEJORES ATRIBUTOS Y CONSIDERANDO EL COSTO DE LA CLASIFICACIÓN If Taller de Lectura y Redacción 1 = No Presentado then Suspendió If Ciencias Sociales 1 = No Presentado and Humanidades 1 = No Presentado then Suspendió If Humanidades 1 = No Presentado and Matemáticas 1 = Deficiente then Suspendió If Matemáticas 1 = No Presentado and Calificación de EXANI I = Muy Deficiente then Suspendió If Taller de Lectura y Redacción 1 = Deficiente and Ciencias Sociales 1 = Deficiente then Suspendió If Matemáticas 1 = No Presentado and Inglés 1 = No Presentado then Suspendió If Inglés 1 = Deficiente and Computación 1 = Regular then Suspendió If Ciencias Sociales 1 = Deficiente and Física 1 = Deficiente then Suspendió If Computación 1 = Deficiente and Matemáticas 1 = Deficiente then Suspendió If Ciencias Sociales 1 = No Presentado and Semestre y Grupo = 1º R then Suspendió If Inglés 1 = Deficiente and Semestre y Grupo = 1º G then Suspendió If Humanidades 1 = Deficiente and Matemáticas 1 = Deficiente and Semestre y Grupo = 1º M then Suspendió If Humanidades 1 = No Presentado and Semestre y Grupo = 1º E then Suspendió

VII.

CONCLUSIONES.

En este trabajo, se realizaron un conjunto de experimentos con el objetivo de conseguir predecir con un buen grado de exactitud el estado académico de los estudiantes al final del primer semestre mediante la utilización de algoritmos de clasificación.

115

TABLA XI ÁRBOL OBTENIDO USANDO SimpleCart, LOS 15 MEJORES ATRIBUTOS Y CONSIDERANDO EL COSTO DE LA CLASIFICACIÓN Humanidades 1 = (No Presento)|(Deficiente) | Matemáticas 1 = (No Presentado)|(Deficiente): Suspendió | | Semestre y Grupo = (1º M): Suspendió Humanidades 1! = (No Presentado)|(Deficiente) | Inglés 1 = (Deficiente)|(No Presentado) | | Semestre y Grupo = (1º G): Suspendió | | | Nivel de Motivación = (Regular): Suspendió | | | Nivel de Motivación! = (Regular): Aprobó | Inglés 1! = (Deficiente)|(No Presentado) | | Ciencias Sociales 1 = (Deficiente) | | | Semestre y Grupo = (1º R): Suspendió | | | Semestre y Grupo! = (1º R): Aprobó | | Ciencias Sociales 1! = (Deficiente): Aprobó

Como se ha podido ver, este objetivo no es sencillo conseguirlo, debido a que no sólo se trata de un conjunto de datos desbalanceado, sino que es un problema multifactorial. Es importante, comentar que una tarea muy importante en este trabajo, fue la recopilación de la información y el preprocesado de los datos, ya que la calidad y fiabilidad de la información afecta de manera directa en los resultados obtenidos. Es una tarea ardua, que implica invertir mucho tiempo y disposición de quien esté a cargo de realizarla. En concreto se tuvo que realizar la captura de los datos de la encuesta aplicada, además de hacer la integración de datos de tres fuentes diferentes para formar el conjunto de datos final. Respecto a los resultados de clasificación de las diferentes pruebas, las principales conclusiones que hemos obtenido son: - Se ha mostrado que los algoritmos de clasificación pueden utilizarse con éxito para predecir el rendimiento académico de los estudiantes. - Se ha mostrado la utilidad de las técnicas de selección de características cuando se dispone de muchos atributos, consiguiendo mejorar la clasificación de los algoritmos al utilizar un conjunto reducido de 15 atributos de entre los 77 disponibles inicialmente. - Se ha mostrado dos formas distintas de abordar el problema de clasificación de datos desbalanceados, tanto re-balanceando los datos como considerando distintos costos de clasificación y aplicando una matriz de costos. Ambas formas han conseguido mejorar la clasificación, aunque para nuestro problema en particular la matriz de costos ha obtenido los mejores resultados de clasificación de la clase minoritaria que es lo que más nos interesa. Respecto del conocimiento extraído de los modelos de clasificación obtenidos, las principales conclusiones son: - La utilización de algoritmos de clasificación de tipo “caja-blanca” permiten obtener modelos comprensibles por un usuario no experto en minería de datos en procesos de toma de decisiones. En nuestro caso el objetivo final es poder detectar los alumnos con problemas o tendencia a Suspender/Abandonar para intentar impedirlo a tiempo. - Con respecto a los factores que más han aparecido en los modelos obtenidos: Las notas de las asignaturas del semestre son las que aparecen en mayor medida en las salidas de los algoritmos de clasificación,

ISSN 1932-8540 © IEEE

116

IEEE-RITA Vol. 7, Núm. 3, Nov. 2012 siendo las más importantes los que obtuvieron unas notas deficientes o no se presentaron a las asignaturas de Física 1, Humanidades 1, Matemáticas 1 e Inglés 1. Además otros atributos que han aparecido en los modelos han sido la edad (particularmente los mayores de 15), tener hermanos (particularmente 1), el grupo al que asistió, el nivel (regular) de motivación por estudiar, el no presentarse al Taller de Lectura y Redacción, el vivir en una ciudad grande (particularmente en una comunidad de más de 20 mil habitantes) y el considerar que la asignatura más difícil sea Matemáticas. Llama la atención que la nota deficiente de una asignatura como Humanidades, que generalmente es aprobada por la mayoría de los estudiantes aparezca en los modelos obtenidos como un factor relacionado con el fracaso de los estudiantes. Hay que indicar también que en este estudio hemos utilizado las notas anteriores de los estudiantes y no nos hemos centrado sólo en los atributos sociales, culturales y demográficos debido a dos motivos. Primero, los resultados de clasificación que obteníamos si eliminábamos los atributos de notas anteriores empeoraban muchísimo. Segundo, las notas anteriormente obtenidas por los estudiantes para predecir el fracaso es un recurso muy utilizado en trabajos similares [21], [22].

A partir de los modelos de reglas y los árboles de decisión generados por los algoritmos de minería de datos se puede implementar un sistema que alerte al profesor sobre los estudiantes que potencialmente se encuentren en riesgo de suspender o abandonar, así como a sus padres. Como ejemplo de posibles acciones que pueden servir de ayuda a los estudiantes en riesgo, se propone, que una vez que se detecte un alumno con riesgo, se les asigne un profesor-tutor para que les brinde un apoyo tanto académico como motivador y orientador para intentar evitar el fracaso del alumno. Finalmente, como siguiente paso en nuestra investigación vamos a realizar más pruebas utilizando otros datos que estamos actualmente capturando y pre-procesando. Y como líneas de trabajo futuro, podemos destacar las siguientes: - Desarrollar un algoritmo propio de clasificación/predicción basado en programación genética basada en gramática para poder compararlo con los resultados de algoritmos clásicos y obtener mejores resultados de predicción. - Intentar predecir el fracaso o abandono de los alumnos lo antes posible, mientras más temprano mejor, para poder detectar a los alumnos en peligro a tiempo antes de que ya sea tarde. - Proponer métodos para ayudar a los alumnos detectados dentro del grupo de riesgo de suspender o abandonar. Posteriormente comprobar que porcentaje de las veces fue posible evitar que un alumno detectado a tiempo fracasara o abandonara.

REFERENCIAS [1]

[2] [3]

[4] [5] [6]

[7]

[8]

[9]

[10] [11] [12] [13] [14] [15]

[16] [17] [18] [19]

AGRADECIMIENTOS

Los autores agradecen el soporte económico proporcionado por el ministerio de educación, ciencia e innovación (Proyecto TIN-2011-22408) y la Junta de Andalucía (Proyecto P08-TIC-3720).

[20]

L. A. Alvares Aldaco, “Comportamiento de la Deserción y Reprobación en el Colegio de Bachilleres del Estado de Baja California: Caso Plantel Ensenada”, X Congreso Nacional de Investigación Educativa. México, 2009. F. Araque, C. Roldán, A. Salguero, “Factors Influencing University Drop Out Rates”, Computers & Education, vol. 53, pp. 563–574, 2009. M. N. Quadril and N. V. Kalyankar, “Drop Out Feature of Student Data for Academic Performance Using Decision Tree Techniques”, Global Journal of Computer Science and Technology, vol. 10, pp. 2-5, 2010. C. Romero and S. Ventura, “Educational data mining: A Survey From 1995 to 2005”, Expert System with Applications, vol. 33, pp. 135-146, 2007. C. Romero and S. Ventura, “Educational Data mining: A Review of the State of the Art”, IEEE Transactions on Systems, Man, and Cybernetics, 2010. S. Kotsiantis, K. Patriarcheas and M. Xenos, “A Combinational Incremental Ensemble of Classifiers as a Technique for Predicting Students´ Performance in Distance Education”, Knowledge Based System, vol. 23, no. 6, pp. 529-535, 2010. J. Más-Estellés, R. Alcover-Arándiga, A. Dapena-Janeiro, A. Valderruten-Vidal, R. Satorre-Cuerda, F. Llopis-Pascual, T. RojoGuillén, R. Mayo-Gual, M. Bermejo-Llopis, J. Gutiérrez-Serrano, J. García-Almiñana, E. Tovar-Caro, E. Menasalvas-Ruiz, “Rendimiento Académico de los Estudios de Informática en Algunos Centros Españoles”, XV Jornadas de Enseñanza Universitaria de la Informática, Barcelona, Reporte de Conferencia, 2009. S. Kotsiantis, “Educational Data Mining: A Case Study for Predicting Dropout – Prone Students”, Int. J. Knowledge Engineering and Soft Data Paradigms, vol. 1, no. 2, pp. 101–111, 2009. I. Lykourentzou, I. Giannoukos, V. Nikolopoulos, G. Mpardis and V. Loumos, “Dropout Prediction in e-learning Courses through the Combination of Machine Learning Techniques”, Computers & Education, vol. 53, pp. 950–965, 2009. A. Parker, “A Study of Variables That Predict Dropout From Distance Education”, International Journal of Educational Technology, vol. 1, no. 2, pp. 1-11, 1999. Aluja, T., "La minería de datos, entre la estadística y la inteligencia artificial", Quaderns d'Estadística i Investigació Operativa, vol. 25, num 3., pp. 479-498, 2001. M. M. Hernández, “Causas del Fracaso Escolar”, XIII Congreso de la Sociedad Española de Medicina del Adolescente, pp.1-5. 2002. E. Espíndola, A. León, “La Deserción Escolar en América Latina un Tema Prioritario Para la Agenda Regional”, Revista Iberoamericana de Educación, no. 30, pp. 1-17, 2002. I. H. Witten and F. Eibe, “Data Mining, practical Machine Learning Tools and Techniques”, Second Edition, Morgan Kaufman Publishers, 2005. M. A. Hall and G. Holmes, “Benchmarking Attribute Selection Techniques for Data Mining”, Technical Report 00/10, University of Waikato, Department of Computer Science, Hamilton, New Zealand, Julio 2002. Available: http://www.cs.waikato.ac.nz/~ml/publications/2000/00MH-GHBenchmarking.pdf. N. V. Chawla, K. W. Bowyer, L. O. Hall, W.P. Kegelmeyer, “Synthetic Minority Over-sampling Technique”, Journal of Artificial Intelligence Research, 2002, 16:321-357. J. Cendrowska, “PRISM: An algorithm for inducing modular rules”, International Journal of Man-Machine Studies, vol. 27, no. 4, pp. 349-370, 1987. J. R. Quinlan, “C4.5: Programs for Machine Learning”, Morgan Kaufman Publishers, 1993. L. Breiman, J. H. Friedman, R. A. Olshen, C. J. Stone, “Classification and Regression Trees”, Chapman & Hall, New York, 1984. Y. Freund and L. Mason, “The Alternating Decision Tree Algorithm”, Proceedings of the 16th International Conference on Machine Learning, pp. 124-133, 1999.

ISSN 1932-8540 © IEEE

MÁRQUEZ, ROMERO Y VENTURA: PREDICCIÓN DEL FRACASO ESCOLAR MEDIANTE TÉCNICAS...

117

[21] L. Fourtin , D. Marcotte, P. Potvin, E. Roger, J. Joly, “Typology of students at risk of dropping out of school: Description by personal, family and school factors”, European Journal of psychology of education, vol. XXI, no. 4, pp. 363-383, 2006. [22] L. G. Moseley, D. M. Mead, “Predicting who will drop out of nursing courses: A machine learning exercise”, Nurse Education Today, vol. 28, 469-475, 2008.

Cristóbal Romero Morales es profesor titular del departamento de Informática de la Universidad de Córdoba en España. Es doctor en Informática por la Universidad de Granada desde el año 2003. Su área de interés principal es la aplicación de minería de datos educativa.

Carlos Márquez Vera es profesor de la Universidad Autónoma de Zacatecas, México y doctorando en la Universidad de Córdoba, España. Su área de interés principal es la minería de datos educativa.

Sebastián Ventura Soto es profesor titular del departamento de Informática de la Universidad de Córdoba en España. Es doctor en Ciencias por la Universidad de Córdoba desde el año 1996. Su área de interés principal es soft-computing y sus aplicaciones.

ISSN 1932-8540 © IEEE

118

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

119

Sección Especial sobre Ingeniería del Software en eLearning Antonio Sarasa Cabezuelo y José Luis Sierra Rodríguez

Title—Special Section on eLearning Software Engineering Abstract—This invited editorial introduces a special section of the IEEE-RITA journal devoted to ISELEAR’11, the Second workshop on Software Engineering for eLearning held in Madrid, Spain, in September 2011. This section includes the revised and extended version of one paper selected in this 2011 edition of ISELEAR. The editorial summarizes the history of the ISELEAR Workshops and the related efforts, and introduces the work selected. Engineering, Index Terms—Software Engineering, Educational Technology

L

eLearning

I. INTRODUCCIÓN

A serie de talleres ISELEAR (Ingeniería del Software en e-Learning) es un esfuerzo promovido por el grupo de investigación ILSA (Ingeniería de Lenguajes Software y Aplicaciones: http://ilsa.fdi.ucm.es) de la Universidad Complutense de Madrid, que está orientado a promover los aspectos relativos a la aplicación sistemática de la Ingeniería del Software en el desarrollo de aplicaciones e-Learning. En la actualidad, los sistemas e-Learning son una herramienta estándar de soporte a la enseñanza y aprendizaje, tanto a nivel académico (colegios, universidades, etc.) como a nivel empresarial (programas específicos de formación de empleados, aprendizaje a lo largo de la vida, etc.). Esta situación ha generado una demanda creciente de servicios y funcionalidades cada vez más sofisticados, dando lugar a sistemas cada vez más complejos, no únicamente desde el punto de vista tecnológico, sino también desde el punto de vista de su diseño y desarrollo. De esta forma, el creciente aumento en la complejidad de los sistemas e-Learning, junto a las características particulares de los mismos (implicación activa de instructores y otros expertos del dominio en su desarrollo, necesidad de garantizar la preservación de los materiales digitales integrados en la plataforma y proporcionar mecanismos que permitan aislarlos de los constantes cambios en las tecnologías, necesidad de Antonio Sarasa Cabezuelo pertenece al Departamento de Sistemas Informáticos y Computación, Universidad Complutense de Madrid. C/Profesor José García Santesmases, s/n, 28040, Madrid, España (email: [email protected]). José Luis Sierra Rodríguez pertenece al Departamento de Ingeniería del Software e Inteligencia Artificial, Universidad Complutense de Madrid. C/Profesor José García Santesmases, s/n., 28040, Madrid, España(autor de contacto, Tel: +34 91 394 7548; Fax: +34 91 394 7547; email: [email protected]) DOI (Digital Object Identifier) Pendiente

proporcionar una disponibilidad total y niveles de servicio máximo los 365 días del año, etc.) hace necesario extender y adaptar los métodos generales aplicados en la Ingeniería del Software a este dominio particular, a fin de normar mecanismos adecuados para diseñar, implementar y mantener estas aplicaciones. Como resultado, actualmente es posible hablar de una nueva disciplina, la Ingeniería de los Sistemas e-Learning, que cubre los aspectos del desarrollo, implantación y mantenimiento exitosos de este tipo de aplicaciones. Los talleres ISELEAR se centran en los procesos, técnicas, herramientas y procesos tecnológicos que surgen en esta nueva disciplina. Esta sección especial de IEEE-RITA incluye la versión extendida y revisada de un trabajo seleccionado en la edición 2011 del Taller. II. TRAYECTORIA DE ISELEAR ISELEAR comenzó su andadura en 2010, como un taller adscrito a las XV Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2010), evento, a su vez, celebrado en el contexto del III Congreso Español de Informática (CEDI 2010). En el taller, en el que participaron grupos de diversos puntos de la geografía española (Andalucía, Canarias, Comunidad Valenciana, Madrid, Castilla-León, Castilla La-Mancha, …), se evidenció la existencia de una comunidad incipiente de investigadores e informáticos interesados en la vertiente tecnológica y de desarrollo de los sistemas e-Learning. Así mismo, ISELEAR’10 tuvo ya representación en IEEE-RITA, mediante la organización de una sección especial en la que se incluyeron versiones revisadas y extendidas de dos de los trabajos presentados en el taller [2], y dio lugar también a otras iniciativas de difusión [1][4]. El éxito obtenido por la iniciativa llevó a la organización de una segunda edición (ISELEAR’11), ésta vez en Madrid, en la Universidad Complutense, los días 15 y 16 de Septiembre de 2011 [3]. ISELEAR’11 tuvo, de nuevo, la participación de diversos grupos de distintas comunidades (Andalucía, Murcia, Madrid, Castilla La-Mancha, CastillaLeón, Comunidad Valenciana, …). Así mismo, el taller integró también diversas ponencias invitadas por parte de expertos en el campo. Como resultado, se reforzó la percepción de la existencia de una creciente comunidad de investigadores y profesionales interesados en la disciplina. El artículo incluido en la presente sección especial es una versión revisada y extendida de un trabajo seleccionado en ISELEAR’11. Finalmente, en 2012 ISELEAR ha alcanzado ya su tercera edición. En esta ocasión, el taller se celebrará conjuntamente con el XIV Simposio Internacional de Informática Educativa

ISSN 1932-8540 © IEEE

120

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

(SIIE’12) el próximo mes de Octubre de 2012, en Andorra. Está prevista también la organización de una sección especial en IEEE-RITA dedicado a esta nueva edición, que verá la luz en 2013. III. EL TRABAJO SELECCIONADO En esta sección especial se incluye la versión extendida y revisada de un trabajo llevado a cabo por el grupo CHICO (Computer-Human Interaction and Collaboration) de la Universidad de Castilla La-Mancha. Este trabajo es representativo de la complejidad alcanzada por entornos de aprendizaje en dominios específicos, y de cómo el uso de principios arquitectónicos adecuados en el desarrollo de dichos entornos contribuye a controlar dicha complejidad, permitiendo la evolución sistemática de los mismos. Efectivamente, el trabajo describe distintos aspectos del desarrollo y evaluación del sistema Cole-Programming, un sistema integrado en Eclipse y que soporta un aprendizaje por pares de la materia de Programación en el contexto de la enseñanza universitaria de la Informática. Cole-Programming surge como resultado de la evolución de la herramienta COALA, desarrollada también en el contexto del grupo CHICO. El sistema añade a COALA un chat que permite la comunicación en modo síncrono, un foro para soportar la comunicación asíncrona, y un sistema de votación para controlar los distintos procesos colaborativos. Los autores muestran cómo la arquitectura interna de COALA, que utiliza un espacio de tuplas como mecanismo de integración, ha facilitado la extensión desde un punto de vista del desarrollo, y describen los distintos aspectos arquitectónicos y tecnológicos implicados. El sistema descrito es un sistema que se encuentra actualmente en uso en el contexto de los estudios superiores en Informática de la Universidad de Castilla-La Mancha, lo que evidencia la relevancia y el interés del mismo. AGRADECIMIENTOS Nos gustaría agradecer especialmente a Martín Llamas Nistal, Editor Jefe de la revista IEEE-RITA, por brindarnos de nuevo la oportunidad de difundir en IEEE-RITA los esfuerzos que estamos llevando a cabo con los talleres ISELEAR, así como por el constante apoyo que nos ha prestado en la consecución de esta sección especial dedicada a ISELEAR’11, así como de la pasada sección dedicada a ISELEAR’10. Queremos agradecer también a los revisores que han llevado a cabo las revisiones necesarias para llevar esta sección especial a buen puerto.

Este trabajo ha sido parcialmente financiado por el Ministerio de Ciencia e Innovación (proyecto TIN201021288-C02-01), así como por la Universidad Complutense de Madrid (financiación concedida al grupo de investigación 962022). REFERENCIAS [1]

[2] [3]

[4]

J. L. Sierra Rodríguez, A. Sarasa Cabezuelo, Demetrios G. Sampson, Kinshuk, e I. Aedo Cuevas. “Monografía sobre Ingeniería de Sistemas de Aprendizaje Electrónico”. Revista Novática, nº 210, 8-9.

2011

J. L. Sierra, A. Sarasa Cabezuelo. Ingeniería del Software en eLearning (editorial invitada para sección especial ISELEAR’10). IEEE RITA 6(4), 164-166. 2011 J.L. Sierra Rodríguez, A. Sarasa Cabezuelo (eds), “Actas del 2º Taller sobre Ingeniería del Software en eLearning (ISELEAR'11) Madrid, 15-16 de Septiembre de 2011”. Madrid, España.: Ediciones Universidad Complutense de Madrid, 2011. J.L. Sierra Rodríguez, y A. Sarasa Cabezuelo (eds), “Avances en Ingeniería del Software Aplicada al eLearning. Actas Revisadas y Extendidas del Primer Taller de Ingeniería del Software en eLearning, ISELEAR-10 ”. Madrid, España.: Ediciones Universidad Complutense de Madrid, 2010.

Antonio Sarasa Cabezuelo, es Licenciado en C.C.Matemáticas en la especialidad de C.C.Computación por la Universidad Complutense de Madrid, Ingeniero Técnico en Informática por la Universidad Nacional de Educación a Distancia (UNED), e Ingeniero en Informática por la Universitat Oberta de Catalunya(UOC). Actualmente es Profesor Colaborador en la Facultad de Informática de la Universidad Complutense de Madrid, siendo miembro del Grupo de Investigación ILSA (Ingeniería de Lenguajes Software y Aplicaciones). Su investigación se ha centrado en el ámbito del eLearning, lenguajes de marcado y lenguajes específicos del dominio. Fue uno de los desarrolladores del proyecto Agrega de repositorios digitales. Ha publicado más de 50 trabajos de investigación en conferencias nacionales e internacionales. Así mismo, es miembro del Subcomité 36 de AENOR José Luis Sierra Rodríguez, es Licenciado en Informática por la Universidad Politécnica de Madrid y Doctor en Informática por la Universidad Complutense de Madrid. Actualmente es Profesor Titular de Universidad en la Facultad de Informática de la Universidad Complutense de Madrid, donde dirige el Grupo de Investigación ILSA. Su investigación se centra en el desarrollo y uso práctico de herramientas de diseño e implementación de lenguajes informáticos, así como en el desarrollo dirigido por lenguajes de aplicaciones interactivas y web en los campos de las Humanidades Digitales y del e-Learning. Ha publicado más de 100 trabajos de investigación en revistas internacionales, conferencias y capítulos de libros, es revisor de diversas revistas y congresos internacionales y ha participado y dirigido diversos proyectos de investigación en el campo del e-Learning, las Humanidades Digitales y la Ingeniería de Lenguajes Software. Así mismo, es miembro del Subcomité 36 de AENOR

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

121

Cole-Programming: Incorporando Soporte al Aprendizaje Colaborativo en Eclipse Francisco Jurado, Ana I. Molina, Miguel A. Redondo\ Manuel Ortega

Title— Cole-Programming: Shaping Collaborative Learning Support in Eclipse. Abstract— En la docencia de las asignaturas asociadas a las competencias de la Programación, suele emplearse un modelo de enseñanza/aprendizaje basado en la resolución problemas, que en ocasiones implica la aplicación de técnicas como la Programación por Pares. Además, en la realización de estas tareas es habitual el empleo de entornos de desarrollo integrado de uso profesional. Así, puede resultar interesante integrar herramientas en estos entornos para que puedan dar soporte al proceso de aprendizaje/enseñanza. En este artículo se expone cómo se ha adaptado un sistema preexistente para el aprendizaje de la Programación basado en Eclipse, de modo que tenga soporte para realizar tareas colaborativas. Estas han sido especialmente diseñadas para la resolución de problemas de Programación, e integradas dentro del entorno de aprendizaje. Asimismo, se analizan las primeras impresiones recogidas de los estudiantes en las experiencias iniciales realizadas sobre el sistema. Index Terms— Aprendizaje de la Programación, Aprendizaje Colaborativo Asistido por Computador, Eclipse, Espacios de Tuplas, Programación por Pares

D

I. INTRODUCCIÓN

URANTE el proceso de adquisición de los conocimientos y habilidades asociados a competencias de Programación de Computadores (a la que nos referiremos en adelante como Programación) [1], los estudiantes deben hacer frente a diferentes obstáculos [5][8][21]. En las diferentes asignaturas relacionadas con estas competencias, el método de enseñanza más empleado suele basarse en actividades que impliquen resolución de problemas [18][30], reforzando las clases teóricas con

Francisco Jurado es Profesor asociado del Departamento de Tecnologías y Sistemas de Información en la Escuela Superior de Informática de la Universidad de Castilla-La Mancha Paseo de la Universidad, 4. 13071 Ciudad Real (España), e-mail: [email protected] Ana I. Molina es Profesora Contratada Doctora del Departamento de Tecnologías y Sistemas de Información en la Escuela Superior de Informática de la Universidad de Castilla-La Mancha Paseo de la Universidad, 4. 13071 Ciudad Real (España), e-mail: [email protected] Miguel A. Redondo es Profesor Titular del Departamento de Tecnologías y Sistemas de Información en la Escuela Superior de Informática de la Universidad de Castilla-La Mancha Paseo de la Universidad, 4. 13071 Ciudad Real (España), e-mail: [email protected] Manuel Ortega es Catedrático del Departamento de Tecnologías y Sistemas de Información en la Escuela Superior de Informática de la Universidad de Castilla-La Mancha Paseo de la Universidad, 4. 13071 Ciudad Real (España), e-mail: [email protected] DOI (Digital Object Identifier) Pendiente

laboratorios de Programación [29][35] que posibiliten un aprendizaje activo [31]. Dado que los estudiantes deben aprender a diseñar, desarrollar, verificar y depurar programas con determinadas herramientas que están diseñadas para ser empleadas por programadores profesionales tal y como apunta Satratzemi [37], en los laboratorios de Programación se suelen emplear Entornos de Desarrollo Integrado (IDE) de uso profesional, como Eclipse, JDeveloper, NetBeans, IntelliJ, etc. De este modo, introducir mejoras sobre estos entornos a modo de herramientas que den soporte al proceso de aprendizaje/enseñanza en las competencias asociadas con la Programación, puede resultar una aproximación interesante. Por su parte, la implantación de los principios propuestos por parte del Espacio Europeo de Educación Superior (EEES) incluye el trabajo en grupo como una de las técnicas a potenciar en las aulas. En este sentido, el paradigma educativo del Aprendizaje Colaborativo Soportado por Computador (CSCL, Computer Supported Collaborative Learning) [28], pretende aprovecharse del efecto sinérgico que supone el hecho de que varios estudiantes colaboren para resolver un determinado problema, proporcionando el soporte computacional que les permita comunicarse y coordinarse en la realización de sus actividades de aprendizaje. Así, aplicar el paradigma colaborativo en el proceso de enseñanza/aprendizaje de la Programación mediante la resolución de problemas o proyectos en grupo (aprendizaje colaborativo), permitiría introducir los principios del EEES en la adquisición de esta competencia. No en vano, ha sido aplicado al ámbito del aprendizaje de la Programación, existiendo varias propuestas en este sentido [38][34][33] [13]. La , en un entorno computacional típicamente distribuido, que permite a los estudiantes beneficiarse del conocimiento y habilidades del resto de integrantes del grupo, mejorando así sus propias destrezas. Dentro del ámbito del aprendizaje colaborativo aplicado a la Programación, habitualmente se emplea la técnica de la Programación por Pares (del inglés Pair-Programming). En ella, dos programadores trabajan de forma conjunta en un mismo diseño, algoritmo, código o prueba [39], de modo que, mientras que uno de ellos ejecuta acciones sobre el entorno, el otro analiza los pasos de su compañero para tratar de detectar errores e informarle de ellos. Aunque se trata de una técnica típicamente empleada en el campo de la Ingeniería del Software, su aplicación en contextos educativos proporciona interesantes beneficios que mejoran el aprendizaje [36].

ISSN 1932-8540 © IEEE

122

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

En este marco, nuestro objetivo es el de dar soporte a métodos educativos que apliquen la técnica de la Programación por Pares en un IDE de uso profesional. En particular, en el presente trabajo se muestra cómo evolucionar un sistema para el aprendizaje de la Programación ya existente y sin soporte para la realización de tareas colaborativas, el cual está basado en un IDE ampliamente extendido como es Eclipse, dotándole de herramientas colaborativas que quedarán integradas en dicho entorno. Así, el resto del documento se estructura como sigue: se comenzará mostrando los antecedentes sobre los sistemas que permiten dar soporte computacional a los laboratorios de Programación (sección 2); seguidamente se pasará a mostrar cómo dotar de soporte colaborativo al sistema para el aprendizaje de la programación seleccionado (sección 3); a continuación se detallará la funcionalidad específicamente diseñada para tareas de Programación que se ha implementado dentro del entorno (sección 4); posteriormente se mostrará una primera experiencia y se analizarán las impresiones de los estudiantes respecto de las misma (sección 5); y finalmente se expondrán algunos comentarios finales (sección 6). II. ANTECEDENTES Con el fin de posibilitar la realización de actividades que impliquen resolución de problemas de Programación en un escenario donde se complementen las clases teóricas con laboratorios de Programación para fomentar el aprendizaje activo al estudiante, una aproximación que puede resultar beneficiosa para los estudiantes es el uso de entornos de desarrollo reales. Éstos son los llamados Entornos de Desarrollo Integrado (Integrated Development Environment, IDE), programas destinados a ayudar a los desarrolladores en el proceso de implementación de aplicaciones. Este tipo de aplicaciones incluyen herramientas que dan soporte a los programadores durante el proceso de desarrollo en sus diferentes fases. Empleando un IDE real, los estudiantes pueden manipular un entorno de desarrollo como el que encontrarán en su futuro laboral, preparándolos no sólo para aprender los conceptos relacionados con la Programación, sino también para aprender a manipular y sacar provecho de las herramientas que pueden tener a su disposición, favoreciéndoles tanto en su proceso de aprendizaje como en su futuro ambiente profesional. En la actualidad existen multitud de IDEs, ya sean de libre disposición o comerciales. Entre ellos, Eclipse (http://www.eclipse.org) se erige como el más ampliamente utilizado [9][16]. De hecho, las posibilidades de personalización y expansión que proporciona Eclipse no han pasado desapercibidas para los investigadores en el área del aprendizaje de la Programación, pudiéndose encontrar diversas soluciones en este sentido para desarrollos Java. Estas soluciones consisten en plug-ins añadidos a Eclipse para convertirlo en un entorno para el aprendizaje de la Programación. Así, en el proyecto Kenya Eclipse [10][11] se integra el lenguaje Kenya [2][9] diseñado para que los estudiantes se centren en aprender las

estructuras básicas de Programación, eliminando aquellos aspectos relacionados con la sintaxis que no resultan relevantes en las primeras sesiones del aprendizaje de la Programación. Pasar de Kenya a su equivalente Java resulta sencillo, de modo que los estudiantes pueden aprender más fácilmente cómo deberían escribir el correspondiente programa Java. Kenya aprovecha todas las características de Eclipse, tales como la gestión de proyectos, la salida del compilador, etc. Además incorpora un módulo para el análisis del estilo de Programación, que permite que los estudiantes mejoren la escritura y legibilidad del código fuente que generan. Otra aplicación basada en Eclipse es ProPAT [3]. Esta herramienta permite que el profesor pueda proponer un problema de Programación indicando el nombre, el uso y la sintaxis que el estudiante debería seguir a modo de plantilla. Dicha plantilla de sintaxis será posteriormente cotejada con el árbol sintáctico abstracto del código escrito por el estudiante, con lo que el sistema podrá proporcionar al estudiante información relativa a qué ha hecho bien y mal en la solución que ha desarrollado. En esta misma línea de análisis de las soluciones que desarrollan los estudiantes se encuentra COALA (Computer Assisted Environment for Learning Algorithms) [24][25]. Este entorno permite la especificación de actividades de Programación por parte del profesor (junto con la representación ideal según su criterio de evaluación y los casos de prueba que deben cumplirse), su distribución a los estudiantes, la entrega de las soluciones elaboradas por éstos y la evaluación automática de dichas soluciones mediante Lógica Difusa. COALA emplea esta evaluación con un doble objetivo [25]: por un lado, proporcionar a los estudiantes una breve explicación de qué está bien y mal en su solución de modo que puedan entenderla y mejorarla; por otro, retroalimentar al sistema, permitiéndole determinar cuál es la siguiente actividad de aprendizaje de entre las especificadas por el profesor, que debe realizar cada estudiante en particular. Por su parte, entre los proyectos que aplican los principios del CSCL y la extensibilidad de Eclipse se encuentran los proyectos Jazz Sangam [12] y RIPPLE [6]. Más concretamente, estas herramientas pretenden construir entornos que posibiliten la Programación por pares. Así, Jazz Sangram [12] es un plug-in diseñado para dar soporte al trabajo colaborativo en el entorno Eclipse. Jazz es una tecnología de IBM para desarrollo colaborativo, que proporciona herramientas de gestión de proyectos, control de versiones, mensajería instantánea, etc. Por su parte Sangam [22] es un plug-in para Eclipse que permite el trabajo colaborativo empleando la técnica de Programación por pares. La integración de Jazz y Sangam es la que da como resultado esta aplicación. De forma similar, RIPPLE [6] construye sobre Eclipse un entorno para Programación por pares mediante la construcción de un editor compartido y un chat sencillo, empleando para ello la arquitectura de Sangam. Sin embargo estos sistemas no cuentan con herramientas colaborativas de comunicación y coordinación de uso tan extendido como foros (que permiten también la comunicación asíncrona), herramientas de votación (que estructuran la toma de decisiones), etc. Tampoco incorporan mecanismos de awareness [15] que permitan tener

ISSN 1932-8540 © IEEE

JURADO et al.: COLE-PROGRAMMING: INCORPORANDO SOPORTE AL APRENDIZAJE COLABORATIVO... 123 consciencia e información sobre el resto de integrantes del grupo de trabajo, su progreso e intenciones futuras. Por otro lado, estos sistemas no disponen de herramientas de monitorización y seguimiento del estudiante, que podrían resultar de gran interés para los profesores (tanto para realizar análisis del proceso de aprendizaje, como para intervenir en las sesiones de trabajo en grupo cuando sea necesario). Por tanto, puede verse cómo el entorno Eclipse resulta adecuado para ser empleado como base en el desarrollo de aplicaciones para el aprendizaje de la Programación. Por un lado, el uso de Eclipse permite a los desarrolladores centrarse en implementar las funcionalidades puramente educativas, liberándoles de la implementación de herramientas comunes como las de gestión de proyectos, editores de código, integración con el compilador y el depurador, etc. Por otro lado, las herramientas educativas desarrolladas se encuentran integradas en entornos que los estudiantes encontrarán en su futuro profesional. El presente trabajo toma como punto de partida el entorno distribuido COALA citado anteriormente, el cual fue desarrollado como consecuencia de nuestras investigaciones previas en el ámbito de los sistemas destinados al aprendizaje de la Programación, pero que carecía de soporte para tareas colaborativas. En la siguiente sección se mostrará cómo dotar de soporte colaborativo a COALA. III. DOTANDO A ECLIPSE DE SOPORTE A LA COLABORACIÓN Como se ha mencionado en el apartado anterior, el punto de partida para nuestro trabajo es COALA [24][25]. Éste fue desarrollado como plug-ins para Eclipse, con el fin de permitir el empleo de un entorno de Programación real en un ámbito académico, el cual hace uso de estándares educativos para facilitar la reutilización e integración con otros sistemas, destacando el empleo de IMS-LD [23]. El plug-in para Eclipse de COALA permite la comunicación a través de un servidor de espacios de tuplas [19][20][27]. Este servidor se comporta como una memoria central compartida en un entorno de red, donde los diferentes clientes y servicios pueden almacenar y leer información en forma de tuplas [26][27]. La opción de los espacios de tuplas resulta apropiada para implementar sistemas colaborativos de eLearning [7][17]. Así, parecía factible emplear la arquitectura de COALA para implementar los nuevos servicios, aprovechando tanto las características de extensión y personalización de Eclipse, como la escalabilidad de un sistema basado en espacios de tuplas. Con ello se implementaron a modo de plug-intres de los servicios colaborativos más habituales, a los que se les dio el nombre de COLE-Programming. Estos servicios son: un chat para permitir la comunicación de modo síncrono; un foro para permitir la comunicación de modo asíncrono; un pool de votaciones que permita sondear, cuestionar, consensuar, etc., a los estudiantes.

Estos servicios están dotados de funcionalidades específicas, especialmente pensadas para la realización de tareas de Programación. A modo de ejemplo, en la figura 1 puede verse la funcionalidad para las herramientas del chat y el foro, donde se destaca, no sólo el intercambio de mensajes inherente a este tipo de servicios, sino funcionalidades como las de compartir código o intercambiar mensajes de error y warning procedentes del compilador o de la ejecución. Dado que como se ha comentado anteriormente COALA hace uso de IMS-LD, son diversas las propuestas que permiten la integración de estos servicios colaborativos al sistema [4][14][32]. Sin embargo, dadas las propiedades arquitecturales de COALA para la integración de agentes y servicios mediante el empleo de espacios de tuplas [27], la tarea de integración queda reducida a la implementación de proxies que abstraen el modelo de datos particular de cada servicio a un modelo básico de tuplas. La figura 2muestra el diagrama de bloques de la arquitectura de COALA una vez añadido el plug-in COLEProgramming. Como puede apreciarse en dicha figura, todos los clientes y servicios están conectados mediante una red TCP. El servidor de espacios de tuplas seleccionado para la implementación fue SQLSpaces (http://sqlspaces.collide.info/) (figura 2 a la derecha), el cual se distribuye bajo licencia libre AGPL. Este se ejecuta sobre una máquina virtual de Java (JVM) e implementa la correspondiente lógica de transformación entre tuplas y base de datos relacional. En el caso concreto de COALA se eligió una base de datos MySQL sobre la que realizar la persistencia. Para que los diferentes clientes y servicios puedan interactuar, éstos precisan de las correspondientes librerías que dan soporte al middleware (SQLSpaces client stubs), tanto si se ejecutan sobre una máquina virtual de Java, como si son empleadas desde cualquier otro lenguaje de programación de entre los soportados por SQLSpace. Este es el caso de las herramientas de las que dispone COALA (zona sombreada en el centro de la figura) y de los servicios de los que dispone (a la izquierda) para permitir la especificación de actividades de Programación por parte del profesor, los casos de prueba que deben cumplirse, la distribución de las tareas a los estudiantes, la entrega de las soluciones elaboradas por éstos y la evaluación automática de dichas soluciones, etc.

Fig. 1. Diagrama de Casos de Uso para las herramientas de chat y foro

ISSN 1932-8540 © IEEE

124

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

Lado del cliente

Otros servicios

Servicios COALA SQLSpaces Client Stubs

Lado del servidor

Eclipse SWT Viewers/Editors

Chat Viewer

Foro Viewer

Pool Viewer

Resto Viewers COALA

Eclipse SWT ContentProviders

Chat Controller

Foro Controller

Pool Controller

Resto Controllers COALA

Chat Proxy

Foro Proxy

Pool Proxy

Resto Proxies COALA

Eclipse Platform

SQLSpaces Client Stubs

JVM

JVM

Lógica conversión Tuplas - SQL

SQLSpaces Server

MySQL

JVM

Conexión TCP Fig. 2. Diagrama de bloques de la arquitectura del sistema

En el lado del cliente (zona central de la figura), puede verse Eclipse como la plataforma a emplear por los usuarios. Tanto la plataforma de Eclipse como las librerías del lado del cliente de SQLSpaces se ejecutan sobra una máquina virtual de Java. Con el fin de facilitar la implementación de las capas superiores, se implementan diferentes proxies que proporcionan la transparencia suficiente respecto del middleware. Sobre esta capa de proxies se encuentran las capas del modelo-vista-controlador que propone Eclipse. Dicho modelo consta de proveedores de contenido (SWT Content Providers) y de las correspondientes vistas y editores (SWT Viewers and Editors) para cada una de las herramientas a

implementar, ya sean de las ya implementadas en COALA (zona central sombreada a la derecha) o de las nuevas herramientas implementadas (el chat, el foro y el pool de votaciones). Como puede apreciarse, la implantación de las herramientas colaborativas sobre la arquitectura inicial de COALA resulta sencilla. Tan sólo es preciso implementar los correspondientes proxies, proveedores de contenido y vistas/editores para hacerlos disponibles en los diferentes clientes. Los mensajes y la información que los usuarios intercambiarán en ellas quedarán representados por tuplas accesibles por el grupo de trabajo en el servidor del espacio de tuplas.

Pestañas de la vista para el chat

Pestañas de la vista para el pool de votaciones

Fig. 3. Herramientas colaborativas implementadas por COLE-Programmingen el entorno COALA

ISSN 1932-8540 © IEEE

Pestañas de la vista para el foro

JURADO et al.: COLE-PROGRAMMING: INCORPORANDO SOPORTE AL APRENDIZAJE COLABORATIVO... 125 En la siguiente sección se describirán a modo de ejemplo, algunos servicios colaborativos implementados a fin de probar la validez de nuestra aproximación, así como las funcionalidades específicas para la Programación que pueden incluírseles a fin de facilitar tareas colaborativas en este dominio. IV. COLE-PROGRAMMING: PLUG-IN PARA DAR SOPORTE A LA COLABORACIÓN Dentro de COALA, el plug-in que se desarrolló para Eclipse en el lado del cliente y que implementa algunas herramientas colaborativas, es al que hemos convenido llamar COLE-Programming (Collaborative Learning Programming). La figura 3 muestra cómo COLE-Programming implementa las diferentes vistas para las herramientas de chat (arriba a la izquierda) y foro (arriba a la derecha) con una serie de funcionalidades específicas para tareas de Programación y que serán descritas más adelante. Además añade un pool de votaciones (abajo). Para facilitar el intercambio de la información, se añadió lo necesario para permitir compartir código, mensajes de error del compilador, mensajes de alerta (warnings), etc. Así, cuando un alumno desea compartir uno de estos elementos a través de un chat o un foro, se abre una ventana de diálogo como la que se muestra en la figura 4. Ésta le permite introducir un mensaje de descripción, el tipo de información que está introduciendo (fragmento de código fuente, mensaje de error o alerta, etc.) y la información a compartir. En el chat o el foro aparecerá un mensaje del tipo ― publicó el : ‖, indicando que la información ha sido publicada para aquellas personas que están conectadas al chat. Los alumnos podrán seleccionar en un combo desplegable dentro del mismo chat

el ― id‖ de la información a visualizar, abriéndose un editor que mostrará tanto el código como la descripción. Además, en el foro se ha añadido un mecanismo de filtrado de mensajes en las conversaciones atendiendo al tipo de mensaje (planteamiento de un problema, propuesta al mismo, crítica de un comentario, etc.) tal y como se muestra en la figura 5 (arriba). Una gama de colores identifica al tipo de comentario, de modo que los estudiantes pueden identificar rápidamente el tipo de mensaje de que se trata. Además, un desplegable les permite filtrar el tipo de mensajes a mostrar, permitiéndoles por ejemplo, visualizar sólo las propuestas de soluciones a un problema, sólo las dudas, etc. Con el fin de ayudar al profesor en las tareas de análisis y seguimiento de las tareas colaborativas de aprendizaje, COLE-Programming implementa un monitor de colaboración (figura 5 abajo) que permite observar determinadas características de la colaboración, como el número de aportaciones de un determinado usuario por cada herramienta, porcentajes de participación, usuarios con los que ha colaborado o compartido información, etc. A lo largo de esta sección, ha podido comprobarse cómo se ha implementado la funcionalidad apuntada como necesaria por los estudiantes para la realización de tareas colaborativas de Programación. Así, se ha mostrado cómo se han añadido a COALA las herramientas de chat y foro con dicha funcionalidad, además de incorporar una herramienta para realizar votaciones y otra para permitir al profesor la monitorización de las actividades colaborativas. Con esto, COLE-Programming permite la utilización de COALA en entornos de aprendizaje colaborativo. En el siguiente apartado se detallará una primera experiencia realizada para analizar la percepción de COLE-Programming por parte de los estudiantes.

Código fuente, mensaje de error, etc. Mensaje de descripción Tipo de mensaje (código, error, warning, etc.) Id del mensaje compartido

Fig. 4. Compartir código, mensajes de error y alerta, etc.

ISSN 1932-8540 © IEEE

126

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012 V. PRIMERA EXPERIENCIA CON ESTUDIANTES

Actualmente, el soporte computacional en la mayoría de centros educativos se limita a la implantación de plataformas de gestión de cursos, más conocidas por su término en inglés Learning Management Systems (LMS). Éstos proporcionan repositorios de material didáctico, test de auto-evaluación a disposición de los estudiantes, aplicaciones a emplear por el profesor para el seguimiento y monitorización del uso que los estudiantes hacen de estos entornos, así como herramientas de colaboración síncronas y asíncronas (chats, foros o herramientas de votación) que

añaden un componente más colaborativo a este soporte computacional. Este último tipo de herramientas pueden emplearse para cubrir ciertas necesidades de coordinación, comunicación y colaboración entre profesores y estudiantes. Así, en una primera experiencia, se trató de comprobar si los estudiantes preferían emplear herramientas colaborativas específicas para la Programación, incluidas dentro del Entorno de Desarrollo Integrado que emplean para realizar las tareas, o aquellas proporcionadas por otras alternativas genéricas basadas en LMS.

Selección del filtro

Qué usuario se monitoriza

Actividad

Participación

Para cada herramienta

Colaboración

Fig. 5. Arriba, filtrado de mensajes en los foros.Abajo, estadísticas de colaboración que muestra COLE-Programming

ISSN 1932-8540 © IEEE

JURADO et al.: COLE-PROGRAMMING: INCORPORANDO SOPORTE AL APRENDIZAJE COLABORATIVO... 127 Para ello, se tomó la evolución llevada a cabo en COALA mediante el plug-in COLE-Programming con las herramientas específicamente diseñadas para el aprendizaje de la Programación. Posteriormente fue empleado por estudiantes, quienes contrastaron dichas herramientas con las proporcionadas por un LMS de uso extendido como es Moodle para la realización de tareas de Programación. A. Participantes En la experiencia llevada a cabo participó un grupo de dieciséis estudiantes de la asignatura Sistemas para la Colaboración de quinto Curso de la Ingeniería Superior en Informática de la Universidad de Castilla-La Mancha (UCLM). Se seleccionó este perfil de estudiante dado que tenían los conocimientos necesarios tanto en el ámbito de la Programación (para valorar las herramientas de soporte a la Programación), como en el ámbito de los sistemas colaborativos (que les permite proporcionar una visión más objetiva y crítica en los temas relacionados con el soporte colaborativo implementado). B. Fase Previa a la Experiencia Antes de comenzar la experiencia, con el fin de conocer si existe sesgo en las respuestas de los estudiantes debidas a sus predilecciones, hábitos, etc., se diseñó un cuestionario para identificar el grado de conocimiento y preferencias sobre IDEs de Programación (y de Eclipse en particular), conocer a qué herramientas de comunicación/coordinación suelen recurrir a la hora de realizar tareas colaborativas de Programación, qué tipo de información intercambian a través de las mismas, etc. Los estudiantes ordenaron en una escala Likert de 1 a 5 (siendo 1 la opción menos deseada y 5 la más deseada) sus preferencias en relación a las herramientas colaborativas y el tipo de información que habitualmente intercambian. Como resultados de dicho cuestionario, cabe destacar que los estudiantes optan por el correo electrónico (un 35% y un 41% lo señalaron como la primera y segunda opción respectivamente), seguido del chat (un 44% lo identificaron como primera opción) y el foro (un 22% lo identificaron como segunda opción) como las herramientas colaborativas a usar a la hora de resolver actividades de Programación en grupo, independientemente de que estas sean externas o se encuentren integradas en el entorno. Por otro lado, el análisis de los datos obtenidos permitió determinar cuál es el tipo de información (además de los mensajes de texto) que habitualmente intercambian los estudiantes en estas sesiones de Programación colaborativa, destacando los mensajes de error y warning (un 38% de los estudiante lo marcaron como primera opción y un 25% como segunda) y copias literales de fragmentos de código (un 31% lo identificó como primera opción y un 19% como segunda). C. Descripción de la Experiencia Para la realización de la experiencia, los estudiantes fueron agrupados por los experimentadores en parejas de forma aleatoria. Así mismo, se les proporcionó la información disponible en la página web de COLEProgramming (http://chico.esi.uclm.es/coala), en la que se

incluyó la descripción de herramientas colaborativas y un manual de usuario. La experiencia tuvo una duración de dos horas, en las que los estudiantes debían resolver dos ejercicios de Programación y cumplimentar los correspondientes cuestionarios. Cada test incluía un ID de estudiante, que sirvió para identificar a los participantes en el resto de actividades de la experiencia, preservando así el anonimato. La experiencia constó de las siguientes fases: 1. Primera sesión práctica (Eclipse+Herramientas externas Moodle): en esta primera sesión práctica se les proporcionó el enunciado de un ejercicio de Programación, que debían resolver haciendo uso de la herramienta Eclipse, así como las herramientas externas de comunicación y coordinación incluidas en Moodle (http://moodle.org/), la plataforma LMS implantada en nuestra universidad y que los estudiantes conocían sobradamente. El tiempo aproximado de realización de este primer ejercicio de Programación fue de 40 minutos. 2. Test de valoración (Eclipse+Herramientas externas Moodle): los estudiantes cumplimentaron un test para evaluar su impresión sobre dichas herramientas de colaboración durante la sesión de Programación en grupo. El tiempo para cumplimentarlo fue de 10 minutos. 3. Segunda sesión práctica (Eclipse+COLEProgramming): las mismas parejas de trabajo que participaron en la primera sesión, realizaron una segunda actividad de Programación (con un nivel de complejidad similar al de la primera sesión) haciendo uso de las herramientas integradas en Eclipse (COLE-Programming). El tiempo aproximado de realización de este segundo ejercicio de Programación fue de 40 minutos. 4. Test de valoración (Eclipse+COLE-Programming): los estudiantes cumplimentaron un test para evaluar su impresión sobre dichas herramientas de colaboración durante la sesión de Programación en grupo. El tiempo para cumplimentar fue de 10 minutos. Los test constaron tanto de una serie de preguntas que los estudiantes tuvieron que contestar siguiendo una escala tipo Likert con puntuaciones del 1 al 5 (1: nada, 2: poco, 3: ocasionalmente, 4: a menudo, 5: mucho), como de preguntas de respuesta abierta en las que podían emitir su opinión o dar explicación y justificación sobre determinadas cuestiones. Una vez recopilada toda la información generada durante la experiencia se pasó a su análisis e interpretación, con el objetivo de valorar las herramientas colaborativas que implementa COLE-Programming, así como de las herramientas colaborativas externas no específicas para tareas de Programación, comparando ambas aproximaciones. En la siguiente sección se mostrarán y analizarán los resultados obtenidos.

ISSN 1932-8540 © IEEE

128 80% 70% 60% 50% 40% 30% 20% 10% 0%

80% 70% 60% 50% 40% 30% 20% 10% 0%

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

Chat Foro Herramientas de votación

Fig. 8. Valoración de características de las herramientas colaborativas de COLE-Programming

Chat Foro Herramientas de votación

Fig. 7. Valoración de las herramientas colaborativas. Arriba, puntuación a las herramientas genéricas. Abajo, puntuación a las herramientas integradas en COLE-Programming

D. Resultados Obtenidos de la Experiencia Tras las dos sesiones de prácticas, en las que los estudiantes usaron Eclipse junto con las herramientas colaborativas (las de la plataforma Moodle por un lado y las integradas en COALA mediante el plug-in COLEProgramming por otro), éstos parecen encontrar más usable la herramienta del chat integrada en COLE-Programming que la genérica, dado que incorpora funcionalidad específica para tareas de Programación. En la figura 7 se muestran las gráficas que muestran la valoración proporcionada por los estudiantes a las herramientas colaborativas genéricas y las integradas en COLE-Programming. Analizando dichas gráficas se puede ver cómo el uso de foros y las herramientas de votación parece menos extendido (la mayoría de los estudiantes otorgan un no sabe/no contesta a la hora de puntuar estas herramientas). En las preguntas de respuesta abierta, los estudiantes explicaron el porqué de su inclinación por el uso del chat. Lo consideran la herramienta colaborativa que les permite comunicarse con el compañero de forma más inmediata, permitiendo un diálogo más ágil y menos estructurado. Además, en la figura 7 se puede ver cómo la los estudiantes dan mayor puntuación a las herramientas de COLE-Programming. Así, en el caso de las herramientas genéricas, los estudiantes consideran el empleo del chat y del foro nada, poco u ocasionalmente interesante, pasando a considerar ocasionalmente, bastante o muy valiosos sus equivalentes en COLE-Programming, sobre todo el chat. Los valores tan altos en la opción de “no sabe o no contesta (ns/nc)”, en los casos del foro y la herramienta de votación, se debieron a aquellos estudiantes que optaron por no emplearlas, volviéndose así a confirmar la predilección de los estudiantes por la herramienta de chat.

El principal problema que destacaron en las herramientas colaborativas genéricas fue que éstas no estaban pensadas para compartir código, por lo que carecían de características como una correcta tabulación o el coloreado de sintaxis. Además, indicaron que, al encontrarse en ventanas externas al entorno de trabajo (Eclipse), debían cambiar su foco de atención constantemente haciendo que no pudieran centrarse en la tarea que estaban realizando. Igualmente, los estudiantes analizaron las características introducidas en las herramientas de COLE-Programming específicas para la Programación, como aquellas que permiten compartir código, mensajes de error y warnings, etc. Los resultados pueden apreciarse en la figura 8. En ella se ve cómo las características de compartir código con una correcta identación y formateo, así como el permitir el intercambio de los mensajes de error, mensajes de warning, etc., proporcionados por la salida del compilador, son los rasgos mejor valorados por los estudiantes. Es decir, aquellas funcionalidades añadidas específicamente para las tareas de Programación, resultaron ser las más útiles para los estudiantes. Además, resultan también interesantes a los estudiantes algunas mejoras en el awareness, tales como la personalización de colores para identificar a los usuarios que intervienen en la colaboración y la información relativa al instante de envío del último mensaje. Así, tras evolucionar COALA mediante la implementación del plug-in COLE-Programming, con herramientas colaborativas especialmente diseñadas para realizar tareas de Programación, contrastando su uso frente a las herramientas colaborativas genéricas proporcionadas por un LMS para la realización de tareas colaborativas de Programación, ha podido apreciarse cómo los estudiantes parecen encontrar especialmente atractivas aquellas integradas dentro del entorno de Programación. A la luz de la experiencia descrita, parece que los estudiantes prefieren emplear herramientas colaborativas específicas para la Programación, incluidas dentro del Entorno de Desarrollo Integrado que empleen para realizar las tareas, frente a las proporcionadas por otras alternativas genéricas basadas en LMS no integradas. VI. COMENTARIOS FINALES La Programación por Pares es una de las técnicas empleadas para la resolución de problemas de Programación de forma colaborativa en el proceso de enseñanza/aprendizaje de la competencia de Programación. A lo largo del presente artículo, se ha mostrado cómo dotar de soporte para la realización de tareas colaborativas, a

ISSN 1932-8540 © IEEE

JURADO et al.: COLE-PROGRAMMING: INCORPORANDO SOPORTE AL APRENDIZAJE COLABORATIVO... 129 un sistema para el aprendizaje de la Programación carente de las mismas. Para ello, se ha mostrado cómo han encajado en su arquitectura los requisitos necesarios para proporcionar soporte a la colaboración.. A continuación, se ha pasado a mostrar cómo ha quedado implementada la funcionalidad a modo de un plug-in para Eclipse al que se ha convenido llamar COLE-Programming. Posteriormente, se han analizado las primeras impresiones de los estudiantes respecto de las herramientas integradas en el entorno. Dichas impresiones apuntan que los estudiantes encuentran interesantes las características introducidas en las herramientas por COLE-Programming específicas para la Programación e integradas dentro del Entorno de Desarrollo Integrado que suelen emplear para realizar sus tareas de Programación. AGRADECIMIENTOS La presente investigación ha sido parcialmente subvencionada por el Ministerio de Ciencia e Innovación a través del proyecto “Entorno software para el aprendizaje en grupo de la programación y su integración, mediante estándares, en sistemas de gestión del aprendizaje” (REF: TIN2011-29542-C02-02) con evaluación ANEP, por la Junta de Comunidades de Castilla-La Mancha (España) a través de los proyectos iColab, INTEGROUP (REF.: PPII11-0013-1219) y GITE-LEARN (PEII11-0133-6335) y porla Universidad de Castilla-La Mancha a través del proyecto de innovación docente Prog-Colab. REFERENCIAS [1]

ACM/IEEE (2008), 'Computer Science Curriculum 2008: An Interim Revision of CS 2001. Report from the Interim Review Task Force', Technical report, ACM/IEEE Computer Society. [2] Allwood, T.; Chatley, R. &Sackman, M. (2004), 'Kenya. Technical Report', Technical report, Imperial College London. [3] de Barros, L. N.; dos Santos Mota, A. P.; Delgado, K. V. & Matsumoto, P. M. (2005), A Tool for Programming Learning with Pedagogical Patterns, in 'eclipse '05: Proceedings of the 2005 OOPSLA workshop on Eclipse technology eXchange', ACM, New York, NY, USA, pp. 125-129. [4] de-la Fuente-Valentn, L.; Pardo, A. & Kloos, C. D. (2011), Generic service integration in adaptive learning experiences using IMS learning design, in Computers & Educcation 57(1), pp. 1160-1170. [5] Bonar, J. & Soloway, E. (1983), 'Uncovering Principles of Novice Programming', POPL '83: Proceedings of the 10th ACM SIGACTSIGPLAN symposium on Principles of programming languages, ACM, pp. 10-13. [6] Boyer, K. E.; Dwight, A. A.; Fondren, R. T.; Vouk, M. A. & Lester, J. C. (2008), A Development Environment for Distributed Synchronous Collaborative Programming, in 'ITiCSE '08: Proceedings of the 13th Annual Conference on Innovation and Technology in Computer Science Education', ACM, New York, NY, USA, pp. 158-162. [7] Brecht, J.; DiGiano, C.; Patton, C.; Tatar, D.; Chaudhury, S. R. and Roschelle, J. & Davis, K. (2006), Coordinating Networked Learning Activities with a General-purpose Interface, in 'Proceedings of the 5th World Conference on Mobile Learning'. [8] Brusilovsky, P.; Calabrese, E.; Hvorecky, J.; Kouchnirenko, A. & Miller, P. (1998), 'Mini-languages: a Way to Learn Programming Principles', Education and Information Technologies 2, pp. 65 -83. [9] BZ Research (2008), '5th Annual Eclipse Adoption Study', Technical report. [10] Chatley, R. (2001), 'Java for Beginners', PhD thesis, Imperial College London. [11] Chatley, R. & Timbul, T. (2005), 'KenyaEclipse: Learning to Program in Eclipse', SIGSOFT Softw. Eng. Notes 30(5), 245—248. [12] Devide, J. V. S.; Meneely, A.; Ho, C.-W.; Williams, L. & Devetsikiotis, M. (2008), Jazz Sangam: A Real-Time Tool for Distributed Pair Programming on a Team Development Platform, in 'Workshop on Infrastructure for Research in Collaborative Software Engineering, Atlanta, GA,'.

[13] Duque, R. & Bravo, C. (2008), Analyzing Work Productivity and Program Quality in Collaborative Programming, in 'ICSEA '08: Proceedings of the 2008 The Third International Conference on Software Engineering Advances', IEEE Computer Society, Washington, DC, USA, pp. 270-276. [14] Dodero, J. M. & Ghiglione, E. (2008), ReST-Based Web Access to Learning Design Services, in IEEE Trans. Learn. Technol.1 (3), pp. 190-195. [15] Dourish, P. and V. Bellotti (1992). Awareness and Coordination in Shared Workspaces. Proceedings of the Conference on Computer Supported Cooperative Work CSCW ´92, Toronto, Canada, ACM Press, New York. [16] Eclipse Foundation (2009), The Open Source Developer Report, May 2009. Eclipse Community Survey. [17] Eden, H.; Einsenberg, M.; Fischer, G. & Repening, A. (1996), 'Making learning a part of life', Commun. ACM 39(4), pp. 40-42. [18] Garrido, J.; Noguera, M.; Gonzalez, M.; Gea, M. &Hurtado, M. (2006), Leveraging the Linda Coordination Model for a Groupware Architecture Implementation, in 'Proceedings of 12th International Workshop on Groupware', Springer LNCS, pp. 286-301. [19] Gelernter, D. (1985), 'Generative Communication in Linda', ACM Transactions on Programming Languages and Systems 7 (1), 80-112. [20] Giemza, A.; Weinbrenner, S. & Engler, J.and Hoppe, H. (2007), Tuple Spaces as Flexible Integration Platform for Distributed Learning Environments, in 'Proceedings of ICCE 2007', pp. 313-320. [21] Gomes, A. & Mendes, A. J. (2007), Learning to Program Difficulties and Solutions, in 'International Conference on Engineering Education – ICEE 2007', pp. 283-287. [22] Ho, C.; Raha, S.; Gehringer, E. & Williams, L. (2004), Sangam: A Distributed Pair Programming Plug-in for Eclipse. in 'Systems, Languages, and Applications (OOPSLA), volume Eclipse Technology Exchange at Object-Oriented Programming'. [23] IMS-LD, (2003), 'IMS Learning Design. Information Model, Best Practice and Implementation Guide, XML Binding, Schemas. Version 1.0 Final Specification', Technical report, IMS Global Learning Consortium Inc, Online athttp://www.imsglobal.org/learningdesign (Last visited 08/06/2012) [24] Jurado, F.; Molina, A. I.; Redondo, M. A.; Ortega, M.; Giemza, A.; Bollen, L. & Hoppe, H. U. (2009), 'Learning to Program with COALA, a Distributed Computer Assisted Environment', Journal of Universal Computer Science 15(7), 1472-1485. [25] Jurado, F.; Redondo, M. A. & Ortega, M. (2009), Providing Instructional Guidance with IMS-LD in COALA, an ITS for Computer Programming Learning, in 'Proceedings of the Eclipse/Jazz Technologies for E-Learning, Special Session in Distance Education Technology (DET 2009) International Workshop, The 15th International Conference on Distributed Multimedia Systems (DMS'09)', pp. 211-215. [26] Jurado, F.; Molina, A. I.; Redondo, M. A. & Ortega (2011), Un Enfoque Distribuido Basado en Estándares para la Integración de Servicios y Agentes en Sistemas de eLearning, in Sierra, J.L. & Sarasa, A. eds., Avances en Ingeniería del Software Aplicada al Elearning, Universidad Complutense de Madrid - Área de Ciencias Exactas y de la Naturaleza, pp. 87-102. [27] Jurado, F.; Redondo, M. A. & Ortega, M. (2012), Blackboard Architecture to Integrate Components and Agents in Heterogeneous Distributed eLearning Systems: An Application to Learning to Program, Journal of Systems and Software.vol. 85, Issue 7, pp. 1621– 1636 [28] Koschmann, T. & Erlbaum, L., ed. (1996), CSCL: Theory and Practice of an Emerging Paradigm, Laurence Erlbaum Associates, Publishers. [29] Kumar, A. N. (2002), Learning Programming by Solving Problems, in 'Informatics Curricula and Teaching Methods', pp. 29-39. [30] Makkonnen, P. (2000), Do WWW-based Presentations Support Better (Constructiristics) Learning in the Basics of Informatics?, in '33rd Hawaii Int. Conf. System, Sciences'. [31] McConnell, J. J. (1996), 'Active Learning and its Use in Computer Science', SIGCUE Outlook 24(1-3), pp. 52-54. [32] Muñoz-Merino, P. J.; Kloos, C. D. & Naranjo, J. F., (2009), Enabling interoperability for LMS educational services, in Computer Standards and Interfaces 31 (2), pp. 484–498. [33] Pérez, J. R. P.; del Puerto Paule Ruiz, M. & Lovelle, J. M. C. (2006), SICODE: A Collaborative Tool for Learning of Software Development, in 'IV International Conference on Multimedia and Information & Communication Technologies in Education (mICTE2006)'. [34] Redondo, M.; Bravo, C.; Marcelino, M. & Mendes, A. (2004), Tools for Programming Learning: an Approach to Provide a Social

ISSN 1932-8540 © IEEE

130

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012 Perspective Using Collaborative Planning of Design, in 'IADIS International e-Society 2004 Conference', pp. 315-322. Schollmeyer, M. (1996), Computer Programming in High School vs. College, in 'SIGCSE '96: Proceedings of the twenty-seventh SIGCSE technical symposium on Computer science education', ACM, New York, NY, USA, pp. 378-382. Toll III, V.T., Lee, R. & Ahlswede, T. (2007), 'Evaluating the Usefulness of Pair Programming in a Classroom Setting', Computer and Information Science, ACIS International Conference on 0, 302308. Satratzemi, M.; Dagdilelis, V. & Evagelidis, G. (2001), A system for program visualization and problem-solving path assessment of novice programmers, in 'ITiCSE '01: Proceedings of the 6th annual conference on Innovation and technology in computer science education'. Vizcaíno, A. (2001), 'Enhancing Collaborative Learning Using a Simulated Student Agent', PhD thesis, Universidad de Castilla-La Mancha. Williams, L. & Kessler, R. R. (2002), Pair Programming Illuminated. Addison-Wesley.

Ana I. Molina, es Ingeniera en Informática (2002) y Doctora (2007) por la Universidad de Castilla - La Mancha (España). Se encuentra adscrita a la Escuela Superior de Informática de la Universidad de Castilla La Mancha. Además de la enseñanza, sus principales intereses están en el campo de las Tecnologías de la Información aplicadas al aprendizaje colaborativo y la interacción persona-ordenador.

Francisco Jurado es profesor asociado en la Escuela Superior de Informática de la Universidad de Castilla– La Mancha. Sus áreas de investigación incluyen los Sistemas Tutores Inteligentes para el aprendizaje de la Programación, sistemas de eLearning heterogéneos y distribuidos, estándares de eLearning y entornos colaborativos asistidos por computador. Obtuvo su grado en Ingeniería Informática en 2005 y el grado de Doctor en Informática en 2010 por la Universidad de Castilla-La Mancha.

Manuel Ortega es Catedrático en la Escuela Superior de Informática de la Universidad de Castilla - La Mancha (España). Recibió su Licenciatura (1982) y grado de Doctor (1990) de la Universidad Autónoma de Barcelona (España). Es director de Grupo de Investigación Computer Human Interaction and Collaboration. Sus principales intereses están en el campo de las Tecnologías de la Información aplicadas al aprendizaje colaborativo e interacción persona-ordenador.

[35]

[36]

[37]

[38] [39]

Miguel A. Redondo es doctor en Informática (2002) y Profesor Titular en la Escuela Superior de Informática de la Universidad de Castilla - La Mancha. Sus intereses de investigación se centra en los campos de las Tecnologías de la Información aplicadas a la educación y la interacción persona-ordenador.

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

131

Avances Recientes en Tecnologías de e-learning Retos y Oportunidades Carmen Fernández Panadero, Gregorio Robles y Pilar Sancho

Title—Recent advances in Challenges and opportunities.

N

e-learning

technologies.

es exagerado hablar de "revolución" en el campo de las tecnologías e-learning en los últimos años. De los primitivos sistemas e-learning, utilizados básicamente como repositorios de contenidos, con escasas posibilidades de interacción y basados en paradigmas educativos objetivistas y conductistas (centrados en el profesor), a las aplicaciones actuales, se ha producido un salto de gigante. El mobile learning, las redes sociales, los serious games, los MUVEs (Multi-User Virtual Environments) o los modernos campus virtuales, con sus posibilidades de implementar paradigmas socio-constructivistas para el aprendizaje cooperativo y colaborativo, son sólo una muestra de los avances producidos en el área en pocos años. Pese a todo, siguen existiendo algunas barreras, tales como la complejidad del proceso de creación y producción de ciertos materiales educativos, las dificultades de interoperabilidad entre diferentes plataformas, la dificultad de adopción de los nuevos paradigmas y herramientas por profesores habituados a formas más clásicas de interacción, etc., que suponen un obstáculo en la adopción de este tipo de tecnologías. Esta edición especial pretende avanzar el en estado del arte analizando las debilidades, amenazas, fortalezas y oportunidades de las nuevas tecnologías aplicadas a la educación. En particular, el interés se centra en aplicaciones, herramientas y plataformas, preferentemente en el ámbito del software libre, y/o análisis de casos de estudio innovadores, modelos pedagógicos y guías de mejores prácticas que muestren cómo superar las barreras planteadas y faciliten la incorporación de tecnologías e-learning a la práctica educativa. Esta edición especial se enmarca en el contexto de la red de excelencia eMadrid, un proyecto financiado por la Comunidad de Madrid (S2009/TIC-1650) que aúna a seis universidades madrileñas: la Universidad Carlos III de Madrid (que lidera el proyecto), la Universidad Politécnica de Madrid, la Universidad Complutense de Madrid, la Universidad Nacional de Educación a Distancia, la Universidad Autónoma de Madrid y la Universidad Rey Juan Carlos, así como numerosas empresas y otros entes asociados relacionados con el mundo de la formación. La red eMadrid organiza un seminario mensual de investigación y unas jornadas anuales de dos días, cuyos contenidos se graban y están a disposición del público en O

general en la página (http://www.emadridnet.org).

web

del

proyecto

Este número especial forma parte del esfuerzo de eMadrid para dar a conocer los retos y las oportunidades que nos deparará el e-learning en el futuro próximo. Para esta edición se han recibido 21 contribuciones, cada una de las cuales ha sido revisada por al menos 3 de los 30 miembros del comité de programa, a los que desde aquí agradecemos su tiempo y su esfuerzo. Finalmente, se han seleccionado cinco artículos (24%) para ser publicados en esta edición especial, aunque había muchos otros muy prometedores que esperamos puedan ser mejorados y publicados en un futuro próximo gracias a los comentarios y sugerencias del comité revisor. A continuación se incluyen las biografías de los tres profesores que han compilado esta edición especial. Carmen Fernández Panadero es licenciada en Ciencias Físicas por la Universidad Carlos III de Madrid y doctora en Tecnologías de las Comunicaciones por la Universidad Carlos III de Madrid. Ha trabajado para Andersern Consulting en proyectos relacionados con la tecnología multimedia y la programación para Internet. Desde 1999 trabaja en el Departamento de Ingeniería Telemática de la Universidad Carlos III de Madrid como profesora titular interina. Sus intereses de investigación incluyen entre otros la caracterización de sistemas dinámicos, los entornos creativos para el aprendizaje (simuladores, mundos virtuales, realidad mixta) y la orquestación de procesos educativos. Su actividad como profesora en la Carlos III ha estado compatibilizada con formación a empresas y con su participación en proyectos de investigación, tanto a nivel nacional como internacional, relacionados con estas mismas áreas. Gregorio Robles es profesor titular interino en la Universidad Rey Juan Carlos (Fuenlabrada, Madrid, España), donde obtuvo el título de doctor en febrero de 2006. Además de sus tareas docentes en las áreas de redes de ordenadores, de software libre y de cultura libre, Gregorio dedica su tiempo a investigar en dos áreas: a) el proceso de desarrollo en proyectos de software libre desde un punto de vista de ingeniería de software, y b) aprendizaje basado en nuevas tecnologías. Gregorio ha estado en estancias de investigación en la Wirtschaftsuniversität Wien (AT, 2 meses), University of Maatricht (NL, 4 meses), University of Lincoln (UK, 4 meses), Technische Universität München (DE, 6 meses) y Universität Trier (DE, 3 meses) y es miembro del IEEE y de la IEEE Computer Society. Gregorio ha participado en varios proyectos de investigación y desarrollo, cuya cuantía total suma varios millones de euros, ha publicado más de una docena de trabajos punteros en revistas indexadas y congresos de primer nivel internacional y es co-autor de un libro de texto de introducción al software libre, que ha sido traducido al inglés, italiano y catalán.

ISSN 1932-8540 © IEEE

132

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

Pilar Sancho es profesora contratada doctora en la Facultad de Informática de la Universidad Complutense de Madrid. Es licenciada en Ciencias Físicas y Doctora en Informática por esta misma Universidad, donde compagina sus tareas de docente e investigación desde el año 1999. Pertenece al grupo de investigación en elearning de esta misma facultad, donde centra sus esfuerzos en el área de

investigación de mundos virtuales para el aprendizaje, el aprendizaje colaborativo y el uso de herramientas e-learning como mecanismo para innovación de las metodologías docentes (es la responsable principal del proyecto Nucleo, que investiga sobre la aplicación del juego, la competitividad y la colaboración en el aprendizaje de la programación). Ha participado en múltiples proyectos nacionales e internacionales, y sus trabajos se han publicado en las más prestigiosas revistas del área.

ISSN 1932-8540 © IEEE

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012

133

Sistema Tutor para la Conducción Eficiente de Vehículos de Combustión Abel Rionda, David Martínez, Xabiel G. Pañeda, SeniorMember, IEEE, David Arbesú, J. Emilio Jimenez y F.F. Linera

Title—Tutoring system for efficient driving of combustion vehicles Abstract—One of the sectors that currently generate pollution is road transport. Millions of tons of CO2 are dumped every day into the atmosphere due to this type of human activity. Governments have seen the reduction of such emissions as a priority - which according to various studies could be achieved through more efficient driving. This article presents a driver tutoring system based on active learning and ubiquity paradigms. Through visual and auditory recommendations we are able to get the driver to make their driving more efficient. The system is complemented with a Web portal where the driver can check their driving and receive recommendations for further improvement. To evaluate the performanceof the tutoring system, driving has been monitored and analyzed for 6 weeks with 150 volunteer drivers achieving results that improve the efficient driving metrics and consumption by approximately 10%. Index Terms—efficient driving, active learning, ubicuous learning, tutoring, CO2 reduction.

U

I. INTRODUCCIÓN

NO de los focos de generación de contaminación del aire más importante en la actualidad son los vehículos de combustión [1, 2] y de forma muy particular los diésel. De hecho, diversos estudios [3,4] sitúan las partículas emitidas por estos vehículos como causantes de enfermedades respiratorias como el asma. Otros estudios, como [5] muestran los vehículos de combustión como uno de los principales causantes del calentamiento global por la emisión de CO2. Para paliar estos problemas además de promover un mayor ahorro energético, los gobiernos y asociaciones de conductores lanzan recomendaciones de conducción, si bien, estas son generalistas y no se adaptan al perfil específico de cada conductor. Abel Rionda, David Martínez y David Arbesú pertenecen a ADN Mobile Solutions. Parque Científico Tecnológico de Gijón, España.(email:{abel.rionda,david.martinez,david.arbesu}@adnmobilesolutions.com). Xabiel G. Pañeda pertenece al Departamento de Informática de la Universidad de Oviedo. Edificio Polivalente de Viesques, Campus de Gijón, 33204, Xixón, Asturies, España. (e-mail: [email protected]). J. Emilio Jiménez pertenece a Estudio de Diseño Fivelines, Parque Científico Tecnológico de Gijón, Asturies. España. (e-mail: [email protected]). Francisco Fernández Linera es profesor del Departamento de Ingeniería Eléctrica, Electrónica de Sistemas y Teoría de la Señal de la Universidad de Oviedo. Sedes Departamentales Oeste. Edificio 3. Campus de Gijón, 33204, Xixón, Asturies, España. (e-mail: [email protected]). DOI (Digital ObjectIdentifier) Pendiente

En este sentido TNO Science and Industry indica en una de sus publicaciones [6] que la formación en conducción eficiente es muy efectiva en términos de coste y potencialidad para reducir las emisiones totales del parque móvil en un uno o dos puntos porcentuales. Sin embargo, el proceso de aprender a conducir eficientemente es realmente costoso si se afronta a través de cursos de formación, ya que exige que los conductores pasen por academias especializadas. Una opción más económica podría ser la utilización de tutores inteligentes capaces de asesorar al conductor durante sus desplazamientos de forma que esa rutina de conducir con eficiencia se incorporase poco a poco a sus hábitos. En este sentido la comisión Europea ha aprobado en el año 2012 un reglamento para que los vehículos de tipo turismo incorporen un indicador de cambio óptimo de marcha [7]. En este artículo se presenta un sistema compuesto por elementos software y hardware capaz de realizar recomendaciones al conductor para buscar una conducción eficiente del vehículo mediante un panel gráfico y locuciones de audio. Este tutor, se acompaña de un portal Web para el análisis off-line de la conducción y la obtención de recomendaciones de mejora. El sistema propuesto puede utilizarse en la mayoría de vehículos del parque móvil europeo al ser una solución basada en el estándar OBD-II (OnBoardDiagnostics-II)[8] lo que lo diferencia de otros sistemas con objetivos similares desarrollados por la industria del automóvil para modelos y marcas específicas. Además, el uso del teléfono móvil como punto de interacción con el usuario evita la necesidad de sofisticados dispositivos, universalizando y abaratando el coste. Para evaluar la calidad del sistema se ha realizado un test con 150 conductores que trabajan en la zona conocida como “Milla del Conocimiento” de la ciudad de Gijón durante un periodo de 6 semanas, estudiando cómo su forma de conducir ha variado en el mismo. Los resultados obtenidos indican una mejora de aproximadamente el 10% en los indicadores de conducción eficiente y un descenso en la misma medida del consumo de combustible. El resto del artículo se organiza de la siguiente forma. En la sección II se comentan los trabajos relacionados en el campo de la conducción eficiente. En la sección III se describe la arquitectura del sistema y se detalla el funcionamiento tanto de los elementos hardware como del software. En la sección IV se describe el proceso de evaluación, y por último, en la sección V de comentan las conclusiones y los trabajos futuros.

ISSN 1932-8540 © IEEE

134

IEEE-RITA Vol. 7, Núm. 3, Ago. 2012 II. TRABAJOS RELACIONADOS

En los últimos años, se han publicado diversos estudios [9] que recomiendan el desarrollo de sistemas de apoyo a la conducción como método de reducción de emisiones de gases invernadero. Por ejemplo, dichos trabajos inciden en que los sistemas de feedback o asistentes en tiempo real son uno de los elementos más efectivos para conseguir una conducción eficiente por encima, en lo que se refiere a coste/beneficio, de los cursos cuya utilidad a larga distancia y una vez terminado el periodo formativo presencial no está garantizada. Siguiendo estas recomendaciones diversos fabricantes de vehículos han desarrollado sistemas para promover la eficiencia en la conducción mediante diversas técnicas de apoyo. En el caso del sistema desarrollado por FIAT [10], denominado Ecodrive y uno de los pioneros en el campo de la eco-conducción, éste permite monitorizar el comportamiento del vehículo y del conductor aunque no ofrece feedback en tiempo real. Mediante un puerto USB los coches de esta marca registran los datos sobre la conducción que con posterioridad pueden analizar en el portal que han creado a tal efecto. FIAT anunció para el año 2011 el lanzamiento de su sistema de recomendaciones abordo, si bien todavía no se ha puesto en marcha. Por su parte Nissan ha desarrollado diversos proyectos en eco-conducción como su servicio Carwings [11] o la tecnología Ecopedal [12]. En Carwings el usuario puede solicitar una ruta óptima al destino teniendo en cuenta situaciones históricas y el estado actual del tráfico a partir de la monitorización de vehículos con el servicio activo. Además se realiza un cálculo del consumo de combustible que el usuario puede analizar a través de un portal Web. El sistema ECO-pedal tiene como objetivo controlar la presión sobre el acelerador, mostrando una alerta en el salpicadero y la activación de un mecanismo de push-back sobre el pedal cuando el conductor presiona demasiado el acelerador y se quema más combustible del necesario. Otro trabajo importante en el campo, en éste caso realizado por la Universidad de California, es el proyectoEco-Driving: PilotEvaluation of Driving Behavior Changes Among U.S. Drivers[13]. En él, se utilizó un dispositivo embarcado diseñado ad-hoc para proporcionar al conductor en tiempo real consejos de conducción eficiente, como indicadores consumo de fuel y emisiones de CO2 (utilizando diferentes colores). El estudio se centró en

evaluar cómo estos consejos afectaban al comportamiento de 20 conductores voluntarios. Los resultados indicaron mejoras de alrededor del 6% en consumo de combustible en trayectos urbanos y del 1% en autopistas. El sistema que se presenta en este artículo incluye una serie de innovaciones sobre los sistemas anteriores. En primer lugar presenta un diseño abierto, capaz de ser utilizado en todos los vehículos independientemente de la marca de los mismos. No utiliza componentes hechos adhoc más allá del sensor Cated cuyo coste es muy reducido. Incluye un sistema de recomendaciones abordo (en tiempo real) que indica la marcha a engranar más eficiente en cada momento y la eficiencia del motor, lo que es mucho más intuitivo que utilizar métricas relacionadas con la contaminación. Al almacenar la información en el teléfono móvil la carga de los datos en el sistema central resulta transparente al usuario. Además, el sistema se complementa con un portal Web que permite que el usuario pueda analizar sus rutas y visualizar una estimación de los ahorros realizados con su conducción, lo que busca mantener la motivación como se recomienda en los resultados del proyecto europeo en conducción eficiente TREATISE [14]. III. ARQUITECTURA DEL SISTEMA La arquitectura general del asistente a la conducción es el que se presenta en la figura1. Dicha arquitectura está compuesta por diversos componentes tanto hardware como software: Sistema abordo (on-board): o Sensor Cated para la recogida de datos del vehículo. o Sistema de recepción y recomendación y transmisión del teléfono móvil. Sistema central: o Sistema de almacenamiento y análisis off-line de datos. o Portal Web de asesoramiento al usuario. A. Sistema Abordo: Cated Sensor El sensor Cated es el dispositivo que hace de interfaz del sistema con la centralita del coche. Esta interconexión se realizar a través a través del estándar OBD-II obligatorio en todos los vehículos europeos desde 2001 (2003 para diésel) [8]. El dispositivo es capaz de extraer diversas variables de la centralita del vehículo, como velocidad o revoluciones por minuto, y transmitirlas al teléfono móvil a través de una conexión Bluetooth. Dicha información es transmitida aproximadamente cada 2 segundos. El sensor que es de tamaño reducido, se alimenta desde el propio interfaz OBD-II, lo que permite mantenerlo siempre conectado al vehículo y olvidarse del mismo. Además no necesita ningún tipo de configuración más allá de la interconexión inicial con el teléfono móvil (localización y conexión del Bluetooth). En la figura 2 se puede observar el sensor conectado a un vehículo transmitiendo datos al teléfono móvil en el que está instalado el asistente.

Fig.1 Arquitectura General

ISSN 1932-8540 © IEEE

RIONDA et al.: SISTEMA TUTOR PARA LA CONDUCCIÓN EFICIENTE DE VEHÍCULOS DE COMBUSTIÓN

135

Inicio RPM Velocidad Acelerador CargaMotor RelacionMarchas RPMBase

RPMIdeales = RPMBase + 10%

SI

- Calcular RPM estimadas en cada marcha - Obtener marcha actual

Acelerador > 90%

NO

MarchaActual == 1

NO RPMIdeales = RPMBase + 8%

SI

SI

80% < Acelerador