Michael J. A. Berry & Gordon Linoff
"Data Mining Techniques: for Marketing, Sales, and Customer Support"
John Wiley and Sons, 1997
Un libro destinado a ejecutivos y managers, para que éstos se familiaricen con distintas técnicas de Data Mining existentes, su uso y sus limitaciones. Se cubre desde el análisis de las transacciones comerciales [basket data analysis] hasta la utilización de árboles de decisión, técnicas de clustering, redes neuronales y algoritmos genéticos.
R.J. Brachman, T. Khabaza, W. Kloesgen, G. Piatetsky-Shapiro & E. Simoudis
"Mining Business Databases"
Communications of the ACM, November 1996
En este artículo se comenta el uso de técnicas de Data Mining en distintos ámbitos relacionados con el mundo de los negocios: marketing [vg: database marketing o mailshot response], inversiones financieras, detección de fraudes, CAM [computer aided manufacturing], redes de telecomunicaciones...
Oren Erzioni
"The World-Wide-Web: Quagmire or Gold Mine?"
Communications of the ACM, November 1996
El autor considera que Internet, la WWW, ofrece grandes oportunidades para la extracción automática de conocimiento útil. Según él, "Web Mining" es factible y las técnicas de Data Mining no han de limitarse a bases de datos bien estructuradas.
Usama Fayyad, David Haussler & Paul Stolorz
"Mining Scientific Data"
Communications of the ACM, November 1996
Una de las aplicaciones más interesantes de KDD es el análisis de datos obtenidos en experimentos científicos, permitiendo de ese modo que los científicos se centren en tareas más creativas (como la formación de teorías e hipótesis) y dejando que las máquinas realicen todo el trabajo rutinario. En este artículo se ilustra el potencial del proceso de KDD con algunas aplicaciones reales (como SKICAT, JARtool o CONQUEST).
Usama Fayyad, Gregory Piatetsky-Shapiro & Padhraic Smyth
"The KDD Process for Extracting Useful Knowledge from Volumes of Data"
Communications of the ACM, November 1996
El artículo ofrece una visión general de aquello a lo que nos referimos al hablar de KDD, revisa algunos temas relacionados y concluye con una enumeración de los desafíos a los que han de enfrentarse las investigaciones: gran cantidad de datos, interacción con el usuario, información incompleta, redundancias, técnicas incrementales...
Usama Fayyad & Ramasamy Uthurusamy
"Data Mining and Knowledge Discovery in Databases"
Communications of the ACM, November 1996
Este breve artículo sirve de introducción a una sección especial de la publicación más difundida de la ACM dedicada a Data Mining. Fayyad (de Microsoft) y Uthurusamy (de General Motors) ponen de relieve lo interesante que puede ser la aplicación de técnicas de KDD, un campo prometedor en el que muchos investigadores están trabajando actualmente.
Clark Glymour, David Madigan, Daryl Pregibon & Padhraic Smyth
"Statistical Inference and Data Mining"
Communications of the ACM, November 1996
El artículo trata de lo que la Estadística puede aportar a las técnicas de Data Mining: básicamente, la evaluación de las hipótesis generadas y de los resultados obtenidos.
Tomasz Imielinski & Heikki Mannila
"A Database Perspective on Knowledge Discovery"
Communications of the ACM, November 1996
En esta ocasión se ven los métodos empleados en Data Mining desde otra perspectiva, la de las bases de datos. En este artículo se ponen de manifiesto las limitaciones de SQL a la hora de construir aplicaciones de Data Mining y se expone la necesidad de idear lenguajes de consulta más potentes: "El modelo relacional representa el lenguaje ensamblador de los sistemas modernos (y futuros) de bases de datos" [C.J. Date].
W. H. Inmon
"The Data Warehouse and Data Mining"
Communications of the ACM, November 1996
En este breve artículo se hace hincapié en que la calidad de los datos recopilados (y de la forma en que se han almacenado) es esencial para obtener buenos resultados al aplicar técnicas de Data Mining.
James S. Ribeiro, Kenneth A. Kaufman & Larry Kerschberg
"Knowledge Discovery from Multiple Databases"
First International Conference on Knowledge Discovery (KDD-95), August 1995
En este artículo se propone en realizar un análisis individualizado de las relaciones existentes entre distintas tablas de una base de datos (mediante el uso de claves externas) frente a la alternativa clásica de la construcción de una relación universal a la hora de extraer conocimiento mediante algoritmos del tipo de ID3 (construcción de árboles de decisión) o AQ (generación progresiva de reglas). Las técnicas descritas se han incorporado a un prototipo denominado INLEN [INference and LEarNing].