Los viejos en informática recuerden lo que en otras épocas fue la ESLAI (Escuela Superior Latinoamericana en Informática) y los trabajos y cargos importantes dentro de la industria y la ciencia logrados por sus graduados. ESLAI seguía (junto con Bariloche en energía atómica) un modelo parecido a campus. Una cosa que tengo clara que casi se recibían todos los que entraban, el desgranamiento era mínimo. Eso si, cualquiera no entraba, había que demostrar con conocimientos de física y matemática que estabas preparado para cursar.
jueves, mayo 31, 2007
Reflexiones de un argentino en el MIT
Los viejos en informática recuerden lo que en otras épocas fue la ESLAI (Escuela Superior Latinoamericana en Informática) y los trabajos y cargos importantes dentro de la industria y la ciencia logrados por sus graduados. ESLAI seguía (junto con Bariloche en energía atómica) un modelo parecido a campus. Una cosa que tengo clara que casi se recibían todos los que entraban, el desgranamiento era mínimo. Eso si, cualquiera no entraba, había que demostrar con conocimientos de física y matemática que estabas preparado para cursar.
Cambios en el buscador de imágenes de Google
http://images.google.com/images?q=luján
y luego con
http://images.google.com/images?q=luján&imgtype=face
y compara los resultados.
Pd. ¿Se acuerdan del juego con imágenes, que hace un tiempo atrás nos ofrecía Google?, en el cual nos enganchamos en masa. En ese momento, estoy seguro, que ayudamos a entrenar un reconocedor de imágenes, el cual ya empieza a dar sus primeros frutos. Si es así, viva el "poder social de las redes".
Vía Google Dirson
Entrevista a Manuel Castells
Vía Documenea
¿Cómo marcha el negocio del soft en Argentina?
"... Durante 2006, la facturación de esta industria alcanzó en todo el país los 5.000 millones de pesos con un nivel de ocupación directa de 41 mil personas. Sus exportaciones pasaron de 60 millones de dólares en 2002 a 300 millones en 2006...Según la Organización para la Cooperación y el Desarrollo Económico (OCDE), la Argentina se ubicó en el cuarto lugar entre los países con mayor tasa de crecimiento en sus exportaciones de la industria del software y sistemas informáticos entre 1995 y 2004 ... En la Argentina, en el sector de las Tecnologías de la Información y Comunicación existen unas 900 empresas de tecnología registradas..."
Según la ministra de Producción bonaerense, Débora Giorgi, la República Argentina será un “un actor relevante” a nivel mundial en la industria del desarrollo del soft. Esto lo indicó en el Primer Foro Nacional de Experiencias en Tecnología de la Información y la Comunicación, justificando que si se suman las acciones actuales de promoción, los recursos humanos nacionales, y la facilidad de acceso a mercados se podrá lograr tal objetivo.
Motores de búsqueda y comportamiento de usuarios
miércoles, mayo 30, 2007
Trampa educativa y/o educación con trampa
Creo que estos elevados valores de actos o acciones no normales en ambientes educativos son parte de un proceso de falta de presencia familiar y de escasez de referentes en los ambientes educativos. Algún profesor o comunicador social con tendencia a lo autoritario diría que hay que aplazarlos o echarlos a todos, otros dirían por que no empezamos por casa primero y evaluamos cual es nuestra culpa para llegar a esto.
Recuerden la propaganda del ISP en la cual alumnos le entregaban a la profesora "bellas" monografías (supuestamente "bajadas" de Intenet). y cuando un alumno de la edad de piedra le entregaba al docente una roca tallada con la tarea realizada (la cual debe representar una creación original de su intelecto) se reían y burlaban por lo "bruto". Esa propaganda no la idearon los alumnos, fuimos nosotros los "adultos responsables" los creadores y difusores del "mensaje".
Buscadores: Donde los usuarios centran su atención
Un estudio de la firma Eyetools ha determinado como los usuarios prestan atención a los resultados provistos por la interfase de salida del buscador Google.
- 1ra entrada es vista por el 100%
- 2da entrada es vista por el 100%
- 3ra entrada es vista por el 100%
- 4ta entrada es vista por el 85%
- 5ta entrada es vista por el 60%
- 6ta entrada es vista por el 50%
- 7ma entrada es vista por el 50%
- 8va entrada es vista por el 30%
- 9na entrada es vista por el 30%
- 10ma entrada es vista por el 20%
Webmetría: Factor de Impacto en la web
El FI en su cálculo toma en cuenta la relación existente entre las citas que reciben los artículos de la publicación en estudio, y el número de artíoculos publicados. A los efectos de calcular el FI se computa un período de dos años. El siguiente ejemplo ilustra el cálculo del FI de la revista R para el año 2006
FI(R,2006) = A / B
Donde A es el número de citas que recibieron los artículos de R en el periodo 2004 a 2005.
B es el número de artículos publicados en R en el periodo 2004-2005.
A partir que el espacio web ha sido considerado por autores como un medio válido de difusión de sus ensayos, trabajos de investigación, opiniones, etc y por otro lado, los bibliotecarios han empezado a tenerlo en cuenta como una canal más de información, se han adaptado una serie de métricas clásicas -cuyo origen son las publicaciones papel- a este nuevo espacio. Ahora la métrica Factor de Impacto (WIF) tiene una variante de cálculo cuando se aplica a publicaciones electrónicas. En este caso las citas pasan a ser sitas, y hacen referencias a enlaces que apuntan a un determinado sitio web.
WIF(P) = S / TDonde P es un sitio web
S es el número de enlaces externos al sitio que apuntan a P
T número de páginas citables en P
Para profundizar en el tema leer este artículo de Peter Ingwersen
martes, mayo 29, 2007
Como será Google en 20 años
Off topic. Nevó en los valles de Tucumán
Publico estas fotos por dos cosas: por que estoy orgulloso de mi país y su gente, y por que quiero que personas de otros países vengan a conocerlo, nunca se arrepentirán.
Memorias del Workshop WICC 2007
lunes, mayo 28, 2007
Yahoo apuesta fuerte por las redes sociales
En estos días, a los Laboratorios de Yahoo! se ha incorporado el profesor Duncan Watss, autor de la obra"Six Degrees: The Science of a Connected Age". La compañía pretende profundizar sus estudios en dinámica de sistemas complejos, redes colaborativas y comportamiento de usuarios.
Un cacho de cultura: Arquitectura de un driver de mouse
En este enlace se puede encontrar una explicación, muy didáctica, de como funciona un driver de mouse.
PD. Es increible la sincronización de componentes y el esfuerzo que el "hardware" debe realizar para poder responder a los movimientos de la mano.
domingo, mayo 27, 2007
Pew Internet y un nuevo estudio sobre el SPAM
El 37% de los usuarios de Internet en USA indica que actualmente está recibiendo más correo basura en sus cuentas personales. Un 29% indica que el SPAM se ha incrementado en sus cuentas laborales. La encuesta indica que el 55% de los usuarios ha perdido confianza en el sistema de correo electrónico por causa de este problema. Estos datos datos son aportados por una encuesta realizada por la organización de análisis de la opinión pública Pew Internet.
La autora del trabajo de investigación, Deborah Fallows, asegura que la gente está aprendiendo a combatir el ’spam’, y por ello están menos preocupados por él.
Off topic. Guitarras que merecen ser escuchadas
.
- Vicente Amigo, Tres notas para decir te quiero
- Luis Salinas, La salsalinas
- Lucho Gonzalez, Los ojitos
- Esteban Morgado (con Agri), Viejo ciego
- Tomatito, Bulerías
- Paco de Lucia, Entre dos aguas
- Mark Knopfler, Telegraph road
- Baden Powell, Preludio en A menor
- Toquinho, Samba de Orly
PD. y el hombre de Chivilcoy Pablo Lavallen, pero no hay nada de él en el oráculo Youtube.
sábado, mayo 26, 2007
Inciclopedia versión humorística de la Wikipedia
"...Colón no nació de madre, fue hallado en una excavación en el fondo del océano por el increíble buzo capaz de excavar en el agua. Fue traído a la vida bajo el agua, y tras ser salvado del ahogamiento inmininente por unos marineros que pasaban por allí, decidió ser navegante. Inicialmente trabajó para la marina del Vaticano, quienes le encargaron la búsqueda de la tumba de Cristo que según las teorías de la época se encontraba enterrado en medio del mar. Dado que encontrar un cadáver a la deriva, por muy famoso que sea dicho cadáver, es una tarea difícil, Colón fracasó en el intento.
Desempleado, Colón envió su currículum a todos los reyes de Europa. En él se podía leer lo siguiente: se ofrece marinero para descubrir continentes. Varios años de experiencia, disponibilidad inmediata, rompo los huevos que haga falta para que me contraten. Gracias a ello fue contratado por los Reyes Católicos quienes les subvencionaron un viaje a la India, aunque Colón, que era un juerguista empedirnado, aprovechó el oro para pegarse unas vacaciones en el Caribe.
Tras sus viajes en el Caribe, Colón fue bienvenido con grandes loas en Europa, ya que traía las bodegas llenas de ron y preparó cubatas para todo el mundo. Gracia a esto lo nombraron capitán de la carabela más grande de la época: la Santa María del Titanic. Lamentablemente, Colón montó una fiesta privada con el contramaestre y el vigía, por lo que la carabela se fue hacia el norte y terminó chocando contra un iceberg. El navegante murió congelado, pero feliz."
Tip: Documenta serie de videos sobre historia actual de la Argentina
viernes, mayo 25, 2007
Plagios ¿En mi barrio hay ladrones, y en el tuyo?
Bravo!!! "El profesional de la información" publica libremente sus contenidos
La importante revista científica española "El Profesional de la Información" ha abierto sus contenidos a cualquier internauta que desee consultarlos. Cientos de artículos, desde el año 1992 al 2005, pueden ser ya consultados.
Bravo por la decisión, que buen ejemplo!!!
Paper minería de datos en bibliotecas
Candás Romero, Jorge (2006) Minería de datos en bibliotecas: bibliominería. BiD: textos universitaris de Biblioteconomia i Documentació(17).
Innovar 2007 más de 1600 proyectos presentados
Bravo por los que que trabajan y aportan!!!
FreeWeb7 Alojamiento gratuito
PD. No tiene publicidad visible
Vía Meneame
miércoles, mayo 23, 2007
Recuperación de información: Preprocesamiento II
3.3 – Indexación en base a técnicas no lingüisticas
Como se mencionó, un documento indexado es una representación del documento original. En la práctica, consiste en una lista de términos o conceptos normalizados, de alto valor semántico, con información adicional asociada (por ejemplo, su frecuencia de aparición o posición en el texto). Los términos pertenecientes al índice pueden estar en su forma original o lematizados y pueden ser palabras simples, multipalabras, siglas o nombres propios.
En general, la indexación de base no lingüística se fundamenta en el análisis de la frecuencia de los términos y su distribución dentro de los documentos. Este análisis tiene como objeto establecer criterios que permitan determinar si una palabra es un término de indexación válido, fundamentalmente porque permite discriminar el contenido de los documentos y – de alguna manera – aporta información. Para ello, se han estudiado y determinado algunas propiedades estadísticas del texto escrito que determinan cómo se distribuyen las frecuencias de aparición de las diferentes palabras en una colección y cómo crece el tamaño del vocabulario conforme crece tal colección. Existen dos leyes empíricas que describen estas propiedades: la ley de Zipf y la ley de Heaps, que presentamos a continuación.
3.3.1 – Ley de Zipf
Además de la eliminación de palabras vacías el vocabulario de una colección puede ser podado utilizando otros criterios. Uno de los más utilizados corresponde a la denominada “Ley de Zipf” [66], quien realizó una serie de estudios empíricos en la década de 1940 que demostraron que la gente al es cribir – normalmente – suele preferir palabras más conocidas sobre aquellas menos conocidas. A esto lo denominó s e lo conoce como la ley del menor esfuerzo.
Zipf descubrió que si se armaba una lista con las palabras, junto con su cantidad de ocurrencias (en documentos en inglés), y se la ordenaba por frecuencia de mayor a menor, se cumplía que la frecuencia de la i-esima palabra multiplicada por i (el ranking), era igual a una constante C, es decir:
C = ranking del término t * frecuencia termino t
Hoy en día, para documentos recientemente escritos, esta ley se cumple si se eleva i a un exponente mayor que 1 (en textos en inglés es 1.8), lo cual indica una creciente pobreza en la utilización de la lengua.
Al graficar la curva utilizando una escala logarítmica en x e y, se obtiene una recta con pendiente negativa.
En la tabla siguiente se muestra el cálculo de la constante C sobre algunos términos que forman el vocabulario del libro Tom Sawyer. Nótese que en los primeros lugares aparecen términos del conjunto de las palabras vacías.
Otros trabajos de investigación han demostrado que la ley de Zipf se aplica a otras situaciones relacionadas con la recuperación de información. Para Baeza Yates [http://www.dcc.uchile.cl/~rbaeza/inf/zipf.html] en el espacio web existen fenómenos como los siguientes:
- · Tamaños de los archivos que transfiere el protocolo HTTP.
- · Número de enlaces que salen de una página.
- · Número de enlaces que llegan a una página.
- · Fecha de actualización de las páginas, existen más páginas nuevas o modificadas que viejas.
- · Frecuencia de acceso a páginas web.
El comportamiento del vocabulario de acuerdo a la ley de Zipf brinda indicios acerca de la utilidad de los términos. En 1958, Luhn [34] sugirió que las palabras que describen de mejor forma el contenido se encuentran en un área comprendida entre las altamente frecuentes y las muy raras (baja frecuencia) y lo ilustró con la siguiente gráfica:
Las divisiones verticales definen una zona de transición entre las palabras de frecuencia muy alta y las de muy baja. Aquí se encuentran los términos con mayor contenido semántico de un documento.
El límite superior corresponde – generalmente – al comienzo de las palabras vacías y – como mencionamos – no se indexan por no tener poder de discriminación. Por otro lado, el limite inferior corresponde al comienzo de las palabras más raras, y no se incluyen en el vocabulario debido a que existe una baja probabilidad que el usuario las use en una consulta. Estas palabras de baja frecuencia son las que denotan la riqueza y el estilo de vocabulario del autor o bien, corresponden a errores de ortografía y para establecer su frecuencia límite se sugiere: a) Eliminar aquellos términos que estén en 3 o menos documentos y b) Eliminar todas las palabras
que ocurren una o dos veces [39].
3.3.2 – Ley de Heaps
De manera similar a la ley de Zipf, existe otra ley empírica que describe el comportamiento de los términos dentro de un texto escrito denominada ley de Heaps. En esta ley, se plantea una relación entre el tamaño del texto (cantidad de palabras) y el crecimiento del vocabulario (cantidad de palabra únicas). En particular, postula que el tamaño del vocabulario (y su crecimiento) es una función del tamaño del texto.
V = K * (N^beta)
donde:
K: Constante que depende del texto, típicamente entre 10 y 100.
beta: También es una constante que depende del texto, donde 0 <>
- 10 <= K <= 20
- 0.5 <= beta <= 0.6
Por lo tanto, si K = 20 y beta = 0.5, resulta:
N | V |
100000 | 6325 |
250000 | 10000 |
400000 | 12649 |
800000 | 17889 |
1000000 | 20000 |
Una gráfica de sus valores para diferentes tamaños de documentos, resulta similar a la siguiente:
Los resultados de la ley de Heaps plantean que a medida que se incorporan documentos a una colección, cada vez se descubrirán nuevos términos para el vocabulario.
Su aplicación es directa ya que permite estimar el tamaño del vocabulario con lo cual se puede determinar – por ejemplo – la escalabilidad de las estructuras de datos necesarias para almacenar los índices que soportan el SRI. Esto es altamente útil si se utilizará una tabla de hash en memoria para el índice.
Referencias
[34] Luhn, H.P., “The automatic creation of literature abstracts”, IBM Journal of Research and Development, 2, 1pags. 59-165. 1958.
[39] Peña, R., Baeza-Yates, R., Rodriguez, J.V. “Gestión Digital de la Información”. Alfaomega Grupo Editor. 2003.
[66] Zipf, G. K. “Human Behaviour and the Principle of Least Effort” Reading, MA: Addison- Wesley Publishing Co. 1949.
Google Página de prueba de posibles nuevas funcionalidades
a) Línea de tiempo y Mapa (Timeline & Map View). Incorpora una nueva dimensión a la salida de resultados, donde los mismos se ordenan cronológicamente. Es una herramienta ideal para investigación histórica o periodística, dado que puede marcar las fechas críticas de relevancia de un tema dado. El modo map view muestra los principales resultados sobre un planisferio.
b) Atajos de teclas (Keyboard shortcuts). Opción que tiende a facilitar la navegación a través de atajos de teclas (la idea es no usar el mouse sobre la página de resultados).
c) Panel izquierdo|derecho de búsqueda (Left|rigth hand search navigation). Búsquedas específicas o profundas sobre varias fuentes de contenidos. En un panel se puede filtrar por fuente o acceder a búsquedas relacionadas con la suya.
Noticia.es un "metaDigg" ha nacido
Google Hot Trends, mayo 2007
Google Labs ha actualizado las tendencias de búsqueda de los usuarios. En la página Hot Trends pueden verse los 100 primeros queries a mayo del 2007.
Curiosa presentación sobre investigación acerca de la pornografía
En el blog DesvariandoAndo se traducen los principales resultados de un estudio sobre pornografía en Internet, el cual fue realizado por la revista Good. Lo raro o curioso es que se acompaña la investigación con una presentación en video, donde sobre el cuerpo de una modelo se va escribiendo el contenido de cada slide.
Simposio Global Internet Governance Academic Network (GigaNet)
Fechas importantes
* Symposium date and place: November 11, 2007, Hotel Windsor Barra, Rio de Janeiro, Brazil
* Deadline for submissions: August 1, 2007
* Submit to: GigaNet Program Committee, using the email address info (at)internetgovernance.org
* Notification of status: August 24, 2007
* Papers due: October 1, 2007
martes, mayo 22, 2007
Utilidades para construir galerías fotográficas
Pd. Atento Mauro
Vía Sentido Web
Nuevo sitio de promoción de contenidos de corte educativo
Adelante con el sitio!!!
lunes, mayo 21, 2007
Off Topic: El delicioso arte de hacer graffitis
Los graffitis ya forman parte del paisaje urbano de las grandes capitales. Al principio fueron tomados como una forma de rebeldía, la cual se basaba en "ensuciar" el espacio público. Hoy, bajo mi punto de vista, se han incorporado a las urbes y -en general- son apreciados por los vecinos. Estuve revisando los trabajos de un "graffiter" inglés llamado Bansky, sus obras me han convencido de lo expresado anteriormente, dado que este señor es un artista que ha cambiado su marco en una confortable buhardilla por la libertad y el frío que le ofrecen las paredes londinenses.
Si quieren ver sus trabajos sigan este enlace. A continuación les dejo unas pequeñas muestras de su obra.
Nota: Este último trabajo lo realizó en el Muro de Cisjordania. El cual muestra en pleno el tipo de personas que son los artistas callejeros del graffiti, individuos comprometidos con su sociedad.
Curso "Arquitectura para Cómputos de Altas Prestaciones".
Informes e Inscripcion :
Calle 50 y 115 - 1er Piso - La Plata - Tel/Fax: 0221-4273235
Horario de atencion: lunes a viernes 9 a 13 hs. y de 16:30 a 20:30
Sabados de 9 a 13 hs.
domingo, mayo 20, 2007
Herramientas en línea para trabajar con fotografías
En algún trabajo urgente, o quizás debido a una emergencia, es necesario tener a mano una serie de herramientas en línea para edición básica de fotografía, aquí van mis elegidas:
Pixenate "Photos made easy" (editor básico y con bajos requerimientos)
Fauxto Basado en Flash (necesita plugin)
SlideShow on Line
Dumpr Montones de efectos
Phixr Editor básico
Lookwow Efectos especiales (Requiere plugin Java ;-) )
SnipShot Editor básico
Improve Images Mejorador automático de imágenes
Picture Cloud Generador de efectos
ZingFu Efectos especiales
sábado, mayo 19, 2007
Humor y ciencia
- ingeniero:3,9968743
- físico: 4,0000004 +- 0,0000006
- filósofo: ¿qué quiere decir 2+2?
- lógico: defina mejor 2+2 y le contestaré
- contador: tras cerrar puertas y ventanas, susurra ¿cuánto quiere que de?
Dicho: La experiencia de uno aumenta, a medida que aumentan los aparatos que uno estropea.
Axioma de Allen: cuando todo falla, hay que leer las instrucciones.
Vía Sociedad Panameña de Física
off topic: Cada 7 segundos muere un niño en África
No veas a mi sonrisa y piensa que yo no sé
Que hay abajo y detrás de mi
No quiero que me veas y pienses
Que lo que está dentro de ti está en mí
Lo que está dentro de mí es ayudarles a ellos
Matanza y groserías
Deberíamos utilizar
En los que practican encantos perversos
Por la espada y la piedra
Malos hasta los huesos
La batalla no se ha terminado
Incluso cuando se gana
Y cuando un niño nace en éste mundo
No tiene ningún concepto
De el tono de la piel en la que está viviendo
No es un segundo
7 segundos lejanos
El tiempo que me quede
Estaré esperando
No es un segundo
7 segundos lejanos
El tiempo que me quede
Estaré esperando
Estaré esperando
Estaré esperando
Asumo que las razones que nos empujan para cambiar todo
Quisiera que olvidáramos su color para que puedan tener esperanza
Muchas opiniones de la raza que los hacen desesperar
Deseo que las puertas estén completamente abiertas
A los amigos para hablar de su dolor y su alegría
De modo que podamos dar información
Que no nos dividan para cambiar
7 segundos lejanos
El tiempo que me quede
Estaré esperando
No es un segundo
7 segundos lejanos
El tiempo que me quede
Estaré esperando
Estaré esperando
Estaré esperando
Y cuando un niño nace en éste mundo
No tiene ningún concepto
De el tono de la piel en la que está viviendo
Y hay un millón de voces
Y hay un millón de voces
Para decirte lo que deberías estar pensando
Así que mejor que tomes sobriedad por un segundo
7 segundos lejanos
El tiempo que me quede
Estaré esperando
No es un segundo
7 segundos lejanos
El tiempo que me quede
Estaré esperando
Estaré esperando
Estaré esperando
Video
jueves, mayo 17, 2007
Iden.tify.us, nuevas aplicaciones de la web social
Ponencia sobre optimización de páginas web
Expresión de consulta para buscar Ebooks en Google
Expresión de consulta para buscar Ebooks en Google
+(”index of”) +(”/ebooks”|”/book”) +(chm|pdf|zip|rar) +apache
Micosoft: En casa de herrero cuchillo de palo
Viendo un post del blog histriónicos me entero de algunos números sobre consultas a distintos buscadores por parte de empleados de Microsoft. Bueno el título de esta entrada dice todo lo que sucede allí.
Off Topic: Comerciales de Umbro un hallazgo de creatividad
Les presento una serie de comerciales de Umbro, los cuales juegan con el pensamiento lateral y por ende terminan siendo muy divertidos, Todo un hallazgo.
1) Embarazado
2) No sex
3) En vestuarios después del partido
miércoles, mayo 16, 2007
Tests en línea para medir la comprensibilidad de documentos
Tests en línea para medir la comprensibilidad de documentos
Readability Analysis (Texas University)
Readibility Index Calculator
TxReadibility
Pd. En cuanto termine la función de silabeo en español voy a publicar mi versión en Perl.
Off Topic: Mañana empieza el 6to Festival de Jazz de Buenos Aires
Espacio El Dorrego
Av. Dorrego y Zapiola.
Entrada gratuita. Capacidad limitada.
No se permite la entrada una vez colmada la capacidad del predio. Control permanente de ingreso y egreso de público.
Colectivos: 39, 41, 42, 63, 57, 93, 111, 140, 161, 194.
Anexo: Teatro Presidente Alvear
Av. Corrientes 1659.
Entrada gratuita. Capacidad limitada: 813 espectadores.
Las entradas se retiran en la sede el día de la función respectiva desde las 10 hs. Se entregan hasta dos localidades por persona.
Anexo: Centro Cultural San Martín – Sala Enrique Muiño
Sarmiento 1551.
Entrada gratuita. Capacidad limitada: 270 espectadores.
Las entradas se retiran en la sede el día de la función respectiva desde 2 horas antes del espectáculo.
Comprensibilidad de un documento
Comprensibilidad de un documento
Por Fernando Bordignon
El grado o nivel de comprensibilidad de un determinado texto indica su dificultad de comprensión del contenido, el mismo es determinado por varios factores cuantificables, como ser: longitud de sus oraciones, longitud de sus palabras, especialización de sus palabras, número de proposiciones, cantidad de monosílabos, entre otros. En general, como resultado de la evaluación de un texto se obtiene el nivel de instrucción mínimo necesario por parte de un usuario para comprenderlo.
La comprensibilidad es necesaria en ambientes que tienen por objetivo la confección de documentos de divulgación. En particular la medicina es un ejemplo de un área que utiliza la comprensibilidad en distintas formas, ya sea para medir la facilidad de lectura de informes de consentimiento o de folletos educativos dirigidos a la sociedad [A] [B]. Por otro lado, las métricas de comprensibilidad se aplican a los borradores de material de estudio de la escuela primaria y secundaria [R] con la función de evaluar la calidad de la redacción.
Existen una serie de índices de comprensibilidad que se caracterizan por que reducen a fórmulas la complejidad de la escritura. Flesh [C] fue un pionero del tema y construyo un índice para evaluar periódicos de lengua inglesa, presentó una fórmula que expresaba el grado comprensibilidad en función del promedio de palabras por frase y del promedio de sílabas por palabra. La escala original es la siguiente: a) 100 puntos muy fácil de leer, 65 puntos el texto está dirigido a un ciudadano norteamericano promedio y 0 puntos el documento posee una extrema dificultad para su compresión. Kincaid convierte el índice de Flesch a el nivel de escolaridad necesario para leer y comprender el texto, a continuación se presentan las equivalencias:
Puntaje de Flesch | Escolaridad según Kincaid |
90 to 100 | 5to grado |
80 to 90 | 6to grado |
70 to 80 | 7mo grado |
60 to 70 | 8vo y 9no grado |
50 to 60 | 10mo a 12mo grado |
30 to 50 | College |
0 to 30 | Graduado de college |
Ejemplos de puntajes aplicados a diversas publicaciones o documentos
Comics | 92 | | Time | 52 |
Consumer ads in magazines | 82 | | Newsweek | 50 |
Seventeen | 67 | | Wall Street Journal | 43 |
Reader's Digest | 65 | | New York Times | 39 |
Sports Illustrated | 63 | | Harvard Law Review | 32 |
New York Daily News | 60 | | Poliza de seguros de un automovil | 10 |
El índice de Powers Sumner Kearl [D] mide la comprensibilidad de libros de texto de la escuela primaria para estudiantes con edades de entre los 7 y 10 años. Siempre para la lengua inglesa, Mc Laughlin propuso otro test denominado SMOG [E].
Gunning [CC] en su libro sobre técnicas de escritura propuso otro índice –para el inglés- el cual utiliza como factores de cálculo el promedio de palabras por oración y la cantidad de palabras denominadas “hard words” -palabras no empleadas diariamente -. El resultado es el mínimo nivel de escolaridad sobre el cual el texto es leido fácilmente
En particular, para el español [M] existen una serie de fórmulas de comprensibilidad. Spaulding en 1951 presenta las primeras métricas. Fernandez Huerta [P] adapta al español la fórmula de Flesch. López Rodríguez [S] ha aportado una serie de métricas de comprensibilidad en su tesis doctoral. Una investigación de revisión del tema de comprensibilidad en lenguas distintas a la inglesa es aportada por Rabin [Q]
También existe un índice que mide el grado de especialización técnica (grado técnico) de un documento. Fue propuesta por Fernandez del Moral y evalúa la relación entre los elementos polisémicos especializados, monosémicos especializados y nombres propios especializados. Como resultado indica si el texto en estudio es no especializado, normal o de máxima especialización.
Referencias
[A] García López J. A. Legibilidad de los folletos informativos. Pharm Care Esp 2001; 3:49-56. http://www.pharmaceutical-care.es/esp/2001/n1/pdf_original/legibili.pdf
[C] Flesch, R.E. (1948): The Art of Readable Writing. Harper & Brothers, Nueva York.
[D] Powers, R; Summer, W. y Kearl B "A recalculation of 4 readability formulae". Journal of Education Psycology, University of Birmingham, 49, pp. 99-105.
[E] McLaughlin, H., 'SMOG grading - a new readability formula', Journal of Reading, 1969, 22, 639-646.
[CC] Gunning, R., The Technique of Clear Writing (McGraw-Hill, 1952).
[M] Rodríguez Diéguez, JL. Fórmulas para predecir las condiciones de lectura de textos en español. Aplicaciones a la prensa escrita. TELOS , 1994 (37).
[N] Spaulding, S. (1951): "Two Formulas for Estimating the Reading Difficulty of Spanish", en Educational Research Bulletin, núm. 30, págs. 117-124
[O] Spaulding, S. (1956): "A Spanish Readability Formula", en Modern Language Journal, núm. 40, págs. 433-441.
[P] Fernández Huerta, J. (1959): "Medidas Sencillas de Lecturabilidad", Consigna, núm. 214, págs. 29-32.
[Q] Rabin, A.T. (1988): "Determining Difficulty Levels of Text Written in Languages other than English", en Zakaluck, B.l. y Samuels, S.j. (ed): Readability. Its Past, Present & Futur. Ira, Newark, Delaware, págs. 46-76.
[D] López Rodríguez, N. (1981): Fórmulas de Legibilidad Para la Lengua Castellana. Tesis Doctoral. Departamento de Didáctica,, Universidad de Valencia.
[R] López Rodríguez, N. (1982): Cómo valorar textos escolares. Ed. Cincel, Madrid.
martes, mayo 15, 2007
España, documento "Indicadores de la Sociedad de la información"
En España, el Ministerio de Industria, Turismo y Comercio ha actualizado sus indicadores nacionales de servicios de Internet. El documento "Indicadores de la Sociedad de la información" correspondiente a mayo 2007 puede descargarse aquí.
Las erró todas!!! Un 0 en un examen de 100 preguntas V/F
En el blog Smoke Sellers hay un excelente post sobre un examen multiple choice de 100 preguntas donde un alumno obtuvo un cero. ¿Cómo hizo?
lunes, mayo 14, 2007
Artículo de divulgación: Cómo opera un soft que reconoce rostros
El reconocimiento de caras ha sido un área de investigación de IA donde, históricamente se han invertido una gran cantidad de fondos. El sitio How Stuff Work presenta un artículo de divulgación titulado " How Facial Recognition Systems Work"
domingo, mayo 13, 2007
TK 85 fué mi primera computadora
Origen: Brasil
Fabricante: Microdigital
Lenguaje: Zx81 BASIC (mejorado) embebido
Teclado: incorporado de 4o teclas de goma (una porquería)
CPU: Zilog Z80A a 3.25 MHz (esos eran ciclos de CPU tranquilos, para nada ansiosos como los de hoy)
Interfase de texto: 32 columns por 40 líneas
Interfase gráfica: 64 x 44 puntos Monocromo
Precio: no me acuerdo , pero era barata
Data extraida de Old Computers
Como me hubiera gustado conocer a Almafuerte
Ya que no puedo compartir una mesa con él, solo digo "Salud! Salud por el maestro y poeta combativo, que perdure en la memoria de los eternos insatisfechos que aspiran , por lo menos, a una patria chica más justa y solidaria"
Discurso de Steve Jobs en la Universidad de Stanford
Steve Jobs, durante una fiesta de graduación de la Universidad de Stanford, hace uso de la palbra y relata una serie de historias de vida in6teresantes. El video está subtitulado en español.
Recursos relacionados con la web semántica
Nigel Shadbolt and Wendy Hall and Tim Berners-Lee (2006) "The Semantic Web Revisited". IEEE Intelligent Systems. http://eprints.ecs.soton.ac.uk/
Blog Minding the planet (2006) "
Enrico Motta and Marta Sabou (2006) "Next Generation Semantic Web Applications " http://kmi.open.ac.uk/people/marta/papers/aswc2006.pdf
Andrew Newman (2006) "A relational View of the Semantic Web". http://www.xml.com/pub/a/2007/03/14/a-relational-view-of-the-semantic-web.html
Crawford revie (2006) "Lecture: The Semantic Web". http://www.cis.strath.ac.uk/~crawford/mia/lecture13.pdf
sábado, mayo 12, 2007
Otro intento de menoscabar el movimiento de software libre
Como se nota que el movimiento de SL tiene fuerza y es un competidor de temer, sino nadie hablaría de él, más allá que sus seguidores.
Vía Meneame.net
viernes, mayo 11, 2007
¿Qué pasa con las carreras de informática?
Me parece que desde el estado hace falta un mayor pragmatismo en la formación de profesionales claves para el país y en particular desde el ambiente universitario un mayor compromiso de su dirigencia en este tipo de temáticas. Con la informática ya se ha demostrado que hay excelentes casas de estudio que forman profesionales de primer nivel mundial; lo que falta -a mi parecer- es un compromiso más amplio y una conciencia social que haga comprender que este tipo de acciones son en beneficio de un país.
jueves, mayo 10, 2007
Mister Wong: Nuevo sitio de marcadores sociales en español
He probado este portal Mister Wong, a partir de una cuenta que me han provisto, utilizando una barra especial que se ha añadido a mi navegador Firefox. La misma proporciona tres botones que permiten acceder al portal, cargar la página de mis favoritos o dar de alta la página que estoy visualizando. El alta es muy simple, solo hay que insertar al menos una etiqueta y listo, se almacena el marcador y automáticamente el navegador carga la página original. La interfase de navegación por marcadores propios o de terceros es bastante simple y eficiente. En general me parece un buen servicio, por el el primero, hay que ver como se esmeran los muchachos cuando empiece la competencia.
miércoles, mayo 09, 2007
Call for papers: Revista Enlace Informático
http://enlaceinformatico.unicauca.edu.co
ISSN: 1692-374X
La revista Enlace Informático, hace un llamado a los diferentes investigadores a nivel nacional e internacional, para que envíen sus trabajos de investigación en uno de los siguientes tópicos:
* Procesamiento de Datos y Análisis de Información: Bodegas de datos (Data Warehouse), Procesamiento analítico en línea (OLAP), Minería de datos (Data Mining), Minería de Textos (Text Mining) y Minería en la Web (Web Mining).
* Sistemas de Información: Inteligencia de negocios (BI), Gestión de conocimiento (KM), Administración de la relación con el cliente (CRM), Planeación de los recursos empresariales (ERP) y Administración de la cadena de suministros (SCM).
* Análisis Organizacional: Organizaciones informáticas, sistemas de calidad en informática, procesos y procedimientos organizacionales en informática.
* Seguridad Informática: Criptografía (simétrica y asimétrica), Políticas de seguridad informática y normatividad legal, Auditoria en seguridad informática e Informática forense.
* Inteligencia Artificial: Algoritmos genéticos, Aprendizaje de máquina, Programación evolutiva, Aprendizaje deductivo y Modelos estocásticos.
* Algoritmia y Programación: Complejidad computacional, Programación dinámica y Técnicas de Programación.
* Aplicaciones de la informática en el soporte a las Comunidades Virtuales de Negocios, Tele-Medicina, Tele-Educación, Tele-Trabajo, Bioinformática, Sistemas Tutoriales Inteligentes y Sistemas Colaborativos.
Según la clasificación que realiza el Instituto Colombiano para el Desarrollo de la Ciencia y Tecnología "Francisco José de Caldas" - COLCIENCIAS para los artículos que se publican en Revistas de Ciencia y Tecnología, se ha considerado que en el volumen 6 número 1 de la revista Enlace Informático sólo se tendrán en cuenta artículos de las siguientes categorías:
* Artículo de investigación científica y tecnológica. Documento que presenta, de manera detallada, los resultados originales de proyectos de investigación.
* Artículo de reflexión. Documento que presenta resultados de investigación desde una perspectiva analítica, interpretativa o crítica del autor, sobre un tema específico, recurriendo a
fuentes originales.
* Artículo de revisión. Documento resultado de una investigación donde se analizan, sistematizan e integran los resultados de investigaciones publicadas o no publicadas, sobre un campo en ciencia o tecnología, con el fin de dar cuenta de los avances y las tendencias de desarrollo.
* Artículo corto. Documento breve que presenta resultados originales preliminares o parciales de una investigación científica o tecnológica, que por lo general requieren de una pronta difusión.
* Reporte de caso. Documento que presenta los resultados de un estudio sobre una situación particular con el fin de dar a conocer las experiencias técnicas y metodológicas consideradas en un caso específico.
* Revisión de tema. Documento resultado de la revisión crítica de la literatura sobre un tema en particular.
La responsabilidad del contenido de los artículos es sólo del autor y en ningún momento del editor o de alguna persona involucrada en la publicación de la revista.
Las fechas estipuladas para el desarrollo de la sexta versión de la revista electrónica se pueden observar en la siguiente tabla:
FECHA ACTIVIDAD
9 de Enero de 2007 Apertura del llamado a presentar trabajos (call for papers)
31 de Mayo de 2007 Último plazo para la recepción de artículos
20 de Julio de 2007 Notificación de Aceptación
31 de Agosto de 2007 Fecha límite para la recepción de artículos definitivos (camera-ready)
31 de Octubre de 2007 Publicación y Divulgación del sexto volumen de la Revista
Los artículos deben tener una longitud mínima de 6 páginas y máxima de 12 páginas. Los artículos seleccionados para publicación se podrán observar en http://enlaceinformatico.unicauca.edu.co a partir del 31 de Octubre de 2007.
El idioma oficial para presentar los artículos es el Castellano (Español) con un resumen en inglés y redacción en tercera persona. Los artículos se presentarán a espacio sencillo con una sola columna, el tipo de letra básico será Arial de 10 puntos, los márgenes serán de 2 centímetros con 1 centímetro de encuadernación a la izquierda. El documento se entregará en formato de Microsoft Word.
Para el envío de los artículos debe enviar dos versiones:
* Una que incluya el nombre y afiliación de los autores
* Otra versión del artículo sin referencia a los autores (para la evaluación)
Los artículos se deben enviar a la siguiente dirección enlaceinformatico@unicauca.edu.co, detallando claramente en el texto del correo la siguiente información:
* Título del artículo
* Número de autores
* Número de referencias bibliográficas
* Clasificación según los tópicos de la revista.
* Sobre el (los) autor (es): Nombres, Apellidos, Nacionalidad, E-mail, Dirección, Teléfonos, Institución a la que pertenece, Dependencia, Cargo, Título, Disciplina, Especialidad y Grado de
escolaridad.
En un plazo máximo de 48 horas, el comité organizador confirmará la recepción de los documentos.
El artículo debe ser original y no haber sido publicado en ningún otro tipo de revista.
A continuación se presentan algunas sugerencias para tener en cuenta en la redacción del artículo:
* Utilice un párrafo por cada idea.
* Escriba oraciones cortas para reforzar la idea.
* Trate de que los párrafos estén conectados lógicamente.
* Cuando redacte el primer párrafo de cada numeral, hágalo de forma tal que llame la atención, cautive al lector y sea corto pero enfatice en la idea principal.
* No utilice abreviaturas en exceso.
* La claridad esta por encima de la brevedad.
Puede ampliar esta información en el siguiente documento: Invitación a Publicar en el Volumen 6 de la Revista Enlace Informático e Indicaciones para los autores disponible en
http://enlaceinformatico.unicauca.edu.co/docs/EIv5e01a10.doc
Comité Editor
* Miguel Niño, Universidad del Cauca, Universidad Industrial de Santander
* Carlos Cobos, Universidad del Cauca, Universidad Industrial de Santander
* Elizabeth Granados, Universidad del Cauca, Universidad EAFIT