Archive

Archive for the ‘Uncategorized’ Category

This is the end.

October 26th, 2013

Tan solo poner por escrito lo que supongo que todo el mundo que entra en el blog da por supuesto.
Esta página no se actualiza desde principios de 2009. Dejé la investigación al respecto de este proyecto por falta de tiempo y porqué otros proyectos captaron más mi interés. Dejo lo poco que conseguí y no cierro la web por si puede ser de utilidad para alguien.

Un saludo a todos y gracias a todos los que subisteis en su día manos para que pudiera investigar.

Pasar de lo analógico a lo digital

August 14th, 2009

Actualizo para enlazar un vídeo que me ha parecido muy interesante.
El Dr. Arthur T. Benjamin es un matemático estadounidense especializado en combinatoria y un mago (ilusionista), combinación por la cual es considerado un «matemago».

El proyecto va avanzando. He empezado de nuevo con datos más fidedignos (filtrando jugadores con más de 10mil manos) y intentando analizar menos atributos. En cuanto genere algun resultado medible lo publicaré :)

Saludos.

, ,

Primer estudio y primeras conclusiones. ¡Hay que mejorar!

July 15th, 2009

Hola a todos de nuevo. Hacía bastante tiempo que no posteaba ningún post debido a exámenes y demás. Han ido bastante bien :)

A continuación os cuelgo el primer estudio un poco serio que hemos hecho para hacer la primera toma de contacto con el data Mining en Poker online. Ya os avanzo que las conclusiones han sido un poco malas y que hemos cometido varios errores de bulto, pero por algo se tiene que empezar ;)

Como ya sabéis, la minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos.

Dentro de todas estas técnicas nosotros haremos hincapié en la clusterización.
“Clústering” es el proceso de agrupar datos en clases o clústeres de tal forma que los objetos de un clúster tengan una similitud alta entre ellos, y baja (sean muy diferentes) con objetos de otros clústeres.

Nuestra fuente de información será una inmensa base de datos de más de 22 millones de manos de Texas Hold’em No Limit 50. Una vez tengamos nuestra base de datos con las 22 millones de manos, haremos diferentes filtros para poder tratar mejor la información (preproceso), seleccionaremos los atributos más relevantes y pasaremos al proceso de clusterización. Mediante el análisis de tres experimentos, mostraremos las diferentes posibilidades que ofrecen los distintos algoritmos más conocidos hoy en día: X-means, K-Means y EM.

Para realizar todos los experimentos haremos uso de la potente herramienta: Weka (Waikato Environment for Knowledge Analysis – Entorno para Análisis del Conocimiento de la Universidad de Waikato) es un conocido software para aprendizaje automático y minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Con este software trataremos de lograr nuestros objetivos, que no son otros que estudiar los distintos perfiles existentes en el Poker Online para así poder explotar debilidades y pulir defectos de los jugadores.  ¿Lo conseguiremos?

Ya os avanzo que no :( En estudio no hemos conseguido los resultados esperados. Pero ha servido para darnos cuenta de muchos de nuestros defectos que vamos a pulir.

Read more…

Cositas interesantes

April 22nd, 2009

Este post será un compendio de varias noticias y links interesantes que he leído.

Varios foreros de poker-red se han ofrecido a darme sus databases para colaborar con el proyecto. Es por eso que he creado una nueva sección en dónde quien quiera colaborar puede subir las manos. El link lo tenéis arriba al lado de Acerca del autor :) Por otro lado, también me han informado que en esta web hay miles de manos gratuitas pertenecientes al 2007, lo que es una fantástica ayuda para empezar.

Más cosas.

Read more…

,

Valores estándares para estadísticas (NL)

April 15th, 2009

Removiendo por los foros de Poker he encontrado las stats que usa Silv3rd4v3 (conocido jugador de NL shortstack). En conreto se trata de las stats que él usa en el Holdem Manager. Me parecen un buen punto de partida para poder hacer la caracterización de cada usuario y determinar a qué perfil lo situamos.

Vamos allá:

config HUD

Name/NH
VPIP/PFR/AF/WTSD
Cbet/FCbet/RCbet/FcbetTurn
Fbbs/Fsbs/ATS(orl)/OLS (openlim sb)
3bet/F3bet/Winrate(bb/100)

  • VPIP: 0-11 (tight), 11 – 18 (semiloose), 18+ (loose)
  • PFR: 0-8 (Normal), 8-14 (Algo agressivo), 14+ (demasiado agressivo). Nota: Lo ideal es tener el pfr como mucho un 10%(con respecto al vpip) mas bajo. Claro q el pfr variara en fucnion del vpip q se tenga, pero contra mas distanciados esten, mas pasivo sera.
  • AF: 0-1 (pasivo), 1-2 (normal), 2+ (agressivo)

Read more…

, ,

Estado del arte

April 15th, 2009

Buscando entre diferentes papers y demás he encontrado uno bastante interesante de la universidad Umea de Suecia, concretamente del departamento de ciencias de la computación.

Su objetivo es ganar experiencia en data mining usando distintas técnicas y herramientas junto con largas bases de datos. Es decir, persiguen un objetivo muy similar al nuestro. Antes de seguir, un inciso.

En el mundo del Poker es muy común usar el término “Data Mining” como sustituto de “recolección de datos”. Desde mi punto de vista es incorrecto. Aquí en el blog usaremos el término para hacer referencia a la extracción no trivial de información que reside de manera implícita en los datos.

Una vez aclarado el correcto uso de Data Mining debo decir que el paper es interesante ya que es una primera aproximación al problema de abordar la tarea de extraer conocimiento de las bases de datos, pero las conclusiones a las que llega son muy triviales y algo obsoletas (está escrito en 2005). Eran tiempos del Poker Tracker 2 y usan una base de datos de 170.000 manos.

vpipaggpaper20052

Read more…

Acerca de la recolección de datos

February 20th, 2009

vía poquer-red.

La información es poder, en el póquer más si cabe todavía, y es por ello que minar o tener una buena base de datos de tus rivales es un punto básico par a incrementar tu winrate. Como os decía, el acto de minar hasta ahora era un proceso muy rudimentario, y consistia en dejar a tu ordenador rollo zombie toda la noche, como cuando dejabas el emule de joven (y no tan joven). Por decirlo de alguna forma, es poco eficiente.

De una necesidad, surge una idea de negocio, los servicios de datamining remoto. Básicamente consiste en una empresa que crea una estructura para minar a nivel industrial, por ejemplo, todas las manos, de todos los niveles, de una sala cualquiera. Luego revenden esa información por suscripción o en bloques ya sea semanal, mensualmente, etc…

Ahora bien, ¿merece la pena pagar por algo así? Por mi parte no tengo ninguna duda, pero es que además estamos hablando de un coste realmente ridículo. Por ejemplo, en una de las páginas que os voy a comentar, suscribirse para recibir unas 600.000 manos al mes de NL100$ cuesta 10$… sólo la energía que consumiría tu ordenador en una semana ya lo hace rentable (por no hablar de que no ibas a minar ni la sexta parte de manos).

Read more…

, ,

Cacti

February 20th, 2009

Cacti es una completa solución de graficado en red, diseñada para aprovechar el poder de almacenamiento y la funcionalidad de graficar que poseen las RRDtool. Esta herramienta, desarrollada en PHP, provee un pooler ágil, plantillas de gráficos avanzadas, múltiples métodos para la recopilación de datos, y manejo de usuarios.

Qué es una RRDtool?

RRDtool es el acrónimo de Round Robin Database tool, o sea que se trata de una herramienta que trabaja con una BD que maneja Planificación Round-robin. Esta técnica trabaja con una cantidad fija de datos y un puntero al elemento actual. El modo en que trabaja una base de datos utilizando Round Robin es el siguiente; se trata la BD como si fuera un círculo, sobrescribiendo los datos almacenados, una vez alcanzada la capacidad de la BD. La capacidad de la BD depende de la cantidad de información como historial que se quiera conservar.

Read more…

,

Documentación sobre PostgreSQL

February 19th, 2009

Documentos sobre PokerTracker y su BBDD

February 19th, 2009

Toda la documentación sobre PokerTracker. En ella están relatada la estructura de la base de datos así como manuales de instalación.

http://www.pokertracker.com/products/PT3/docs/

, ,