<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Análisis de Poker Online</title>
	<atom:link href="http://jesusnubiola.com/poker/?feed=rss2" rel="self" type="application/rss+xml" />
	<link>http://jesusnubiola.com/poker</link>
	<description>poco a poco y buena letra</description>
	<lastBuildDate>Thu, 19 Aug 2010 16:18:27 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Pasar de lo analógico a lo digital</title>
		<link>http://jesusnubiola.com/poker/?p=95</link>
		<comments>http://jesusnubiola.com/poker/?p=95#comments</comments>
		<pubDate>Fri, 14 Aug 2009 16:20:36 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Matemáticas]]></category>
		<category><![CDATA[TED]]></category>
		<category><![CDATA[vídeo]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=95</guid>
		<description><![CDATA[Actualizo para enlazar un vídeo que me ha parecido muy interesante. El Dr. Arthur T. Benjamin es un matemático estadounidense especializado en combinatoria y un mago (ilusionista), combinación por la cual es considerado un «matemago». El proyecto va avanzando. He empezado de nuevo con datos más fidedignos (filtrando jugadores con más de 10mil manos) y [...]]]></description>
			<content:encoded><![CDATA[<p>Actualizo para enlazar un vídeo que me ha parecido muy interesante.<br />
El Dr. Arthur T. Benjamin es un matemático estadounidense especializado en combinatoria y un mago (ilusionista), combinación por la cual es considerado un «matemago».</p>
<p><object width="560" height="340"><param name="movie" value="http://www.youtube.com/v/9O6dYmqthF0&#038;hl=es&#038;fs=1&#038;"></param><param name="allowFullScreen" value="true"></param><param name="allowscriptaccess" value="always"></param><embed src="http://www.youtube.com/v/9O6dYmqthF0&#038;hl=es&#038;fs=1&#038;" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="560" height="340"></embed></object></p>
<p>El proyecto va avanzando. He empezado de nuevo con datos más fidedignos (filtrando jugadores con más de 10mil manos) y intentando analizar menos atributos. En cuanto genere algun resultado medible lo publicaré :)</p>
<p>Saludos.</p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=95</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Primer estudio y primeras conclusiones. ¡Hay que mejorar!</title>
		<link>http://jesusnubiola.com/poker/?p=92</link>
		<comments>http://jesusnubiola.com/poker/?p=92#comments</comments>
		<pubDate>Wed, 15 Jul 2009 09:25:20 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=92</guid>
		<description><![CDATA[Hola a todos de nuevo. Hacía bastante tiempo que no posteaba ningún post debido a exámenes y demás. Han ido bastante bien :) A continuación os cuelgo el primer estudio un poco serio que hemos hecho para hacer la primera toma de contacto con el data Mining en Poker online. Ya os avanzo que las [...]]]></description>
			<content:encoded><![CDATA[<p>Hola a todos de nuevo. Hacía bastante tiempo que no posteaba ningún post debido a exámenes y demás. Han ido bastante bien :)</p>
<p>A continuación os cuelgo el primer estudio un poco serio que hemos hecho para hacer la primera toma de contacto con el data Mining en Poker online. Ya os avanzo que las conclusiones han sido un poco malas y que hemos cometido varios errores de bulto, pero por algo se tiene que empezar ;)</p>
<p>Como ya sabéis, la minería de datos (DM, <em>Data Mining</em>) consiste en la extracción no trivial de <a title="Información" href="http://es.wikipedia.org/wiki/Informaci%C3%B3n">información</a> que reside de manera implícita en los <a title="Dato" href="http://es.wikipedia.org/wiki/Dato">datos</a>. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos.</p>
<blockquote><p>Dentro de todas estas técnicas nosotros haremos hincapié en la clusterización.<br />
“Clústering” es el proceso de agrupar datos en clases o clústeres de tal forma que los objetos de un clúster tengan una similitud alta entre ellos, y baja (sean muy diferentes) con objetos de otros clústeres.</p></blockquote>
<p>Nuestra fuente de información será una inmensa base de datos de más de 22 millones de manos de <strong>Texas Hold’em No Limit 50</strong>. Una vez tengamos nuestra base de datos con las 22 millones de manos, haremos diferentes filtros para poder tratar mejor la información (preproceso), seleccionaremos los atributos más relevantes y pasaremos al proceso de clusterización. Mediante el análisis de tres experimentos, mostraremos las diferentes posibilidades que ofrecen los distintos algoritmos más conocidos hoy en día: X-means, K-Means y EM.</p>
<p>Para realizar todos los experimentos haremos uso de la potente herramienta: Weka (Waikato Environment for Knowledge Analysis &#8211; <em>Entorno para Análisis del Conocimiento de la </em><a title="en:University of Waikato" href="http://en.wikipedia.org/wiki/University_of_Waikato"><em>Universidad de Waikato</em></a>) es un conocido <a title="Software" href="http://es.wikipedia.org/wiki/Software">software</a> para <a title="Aprendizaje automático" href="http://es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico">aprendizaje automático</a> y <a title="Minería de datos" href="http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos">minería de datos</a> escrito en <a title="Lenguaje de programación Java" href="http://es.wikipedia.org/wiki/Lenguaje_de_programaci%C3%B3n_Java">Java</a> y desarrollado en la <a title="en:University of Waikato" href="http://en.wikipedia.org/wiki/University_of_Waikato">Universidad de Waikato</a>. Con este software trataremos de lograr nuestros objetivos, que no son otros que estudiar los distintos perfiles existentes en el Poker Online para así poder explotar debilidades y pulir defectos de los jugadores.  ¿Lo conseguiremos?</p>
<p><strong>Ya os avanzo que no :(</strong> En estudio no hemos conseguido los resultados esperados. Pero ha servido para darnos cuenta de muchos de nuestros defectos que vamos a pulir.</p>
<p><span id="more-92"></span></p>
<p>Hemos cometido muchos errores, el más grave de los cuales ha sido subestimar el preprocesamiento de los datos. Antes de lanzarte hacia un ejercicio de clusterización debes estudiar concienzudamente los datos a tratar. Si bien es verdad que nuestro primer error ha sido tratar con una base de datos demasiado escasa (por los atributos que queríamos analizar), no es menos cierto que quizás el nivel escogido tampoco ha sido el adecuado. <strong>Debíamos haber tratado de importar una base de datos de un nivel más elevado de juego (e.g. NL200+) dónde los jugadores son mucho más sistemáticos jugando y no existe tanto jugador ocasional. </strong><br />
A raíz de qué cantidades de manos son necesarias para cada stat, ha surgido una discusión en un importante <a title="Legitimidad de stats" href="http://poquer-red.com/foros/poquer-general/28996-legitimidad-stats.html" target="_blank">foro de poker</a>. En ella se discute sobre la cantidad de manos para considerar una estadística fiable y salen a relucir conceptos como el intervalo de confianza. <strong>Aspectos que deberíamos haber tenido muy en cuenta antes de lanzarnos a la clusterización de los datos</strong> (y más con tantos atributos) ya que sólo que un atributo contenga valores dispares puede hacer que toda la clusterización se vea afectada (no digamos si son más de dos atributos los que tienen valores no fidedignos). Es por esto, por lo que creemos que no hemos obtenido todo lo que cabía esperar de nuestros experimentos, aunque hemos de resaltar, que en el último experimento, los resultados han sido muy esperanzadores porqué ya veíamos dónde estaba el problema y, consecuentemente, filtramos con muchas más manos y menos atributos.</p>
<p>Aún con todas las dificultades que nos hemos encontrado, hemos aprendido mucho sobre clusterización, llegando a la conclusión que para nuestro problema era mejor hacer uso del algoritmo EM en contra de usar el K-medias. También nos hemos familiarizado con usar la herramienta Weka (básica para cualquier trabajo de Data Mining) y ver sus infinitas opciones en filtrados, preprocesamiento, reglas de asociación, visualización de atributos, etcétera. Otra cosa a tener en cuenta es que nos hemos enfrentado a un problema “real”, con una ingente cantidad de datos por filtrar. Sólo la importación de los datos ya ha llevado más de 50 horas. Esto sumado a que la base de datos que crea el Holdem Manager no es conocida (hay muy poca documentación sobre cómo son las tablas) ha hecho que dedicáramos mucho tiempo en hacer ingeniería inversa para poder sacar nuestros datasets.</p>
<p><span style="color: #ff0000;"><strong>A través de la lectura del documento, se puede adivinar que como trabajo futuro lo primero que haremos será preparar bien los datos y hacer un estudio concienzudo sobre qué atributos usar y por qué, calculando qué cantidad de muestras necesitamos para tener ese dato con un intervalo de confianza suficiente para nuestro análisis</strong></span>. Por ejemplo para el cálculo del atributo 3bet  (<a title="Cáclculo de 3bet" href="http://poquer-red.com/foros/poquer-general/28996-legitimidad-stats.html" target="_blank">fuente</a>):</p>
<blockquote><p>Si asumimos la stat dentro del rango 2-9% (lo cual resulta razonable), entonces no deberíamos permitirnos un error mayor al 0,5%.<br />
Para ello podríamos calcular el peor escenario, que se daría en el 9%, y asumiendo ese rango de error.<br />
Si aplicamos esta fórmula:</p>
<p>para determinar el tamaño muestral que necesitamos.<br />
Calculando para:<br />
p (con techito) = 0.09<br />
E = 0.005<br />
z = 1.96</p>
<p>Entonces llegamos a que necesitamos un tamaño muestral n&gt;=12585 manos.</p></blockquote>
<p>Y eso aplicado a una stat que es preflop (3bet), imaginemos los stats que ocurren aún con menos frecuencia como un “River continuation Bet” o similar.</p>
<p>Solamente haciendo un análisis similar con todos los atributos que consideremos necesarios para hacer clústering y filtrando con el número de manos más restrictivo de todos ellos, podremos estar seguros que, en caso de no obtener resultados satisfactorios con los algoritmos de clústering, es problema de que los algoritmos no están suficientemente perfeccionados o que no es un problema en el que aplicar clústering nos aporte nada (que podría ser una <strong>conclusión errónea</strong> de este trabajo).</p>
<p>Otra área muy interesante que nos gustaría haber podido tratar pero no nos ha sido posible por la incoherencia de los resultados obtenidos es la de reglas de asociación. Las reglas de asociación nos permiten atacar por otro bando nuestro problema y nos podrían llegar a dar información muy interesante acerca de cómo se comportan los perfiles de jugadores (en caso de conseguir clusterizar) o jugadores aislados (en caso de no poder clusterizar). Un enfoque que creemos sería muy práctico sería el de ir definiendo acciones claves (a criterio de experto) para ver cómo actúa cada perfil. Por ejemplo el comportamiento de un jugador cuando es robado por un perfil agresor y tiene cartas Premium (KK++) de mano. Ir definiendo numerosas reglas de este estilo e ir llenando nuestro data set con las distintas acciones que nos va respondiendo la base de datos (e.g % de call, raise y fold). Hay que destacar que esta manera de tratar el problema es mucho más compleja que lo que hemos estado haciendo hasta ahora, ya que implica unas sentencias SQL mucho más elaboradas y un agrupamiento en forma de Datasets muy complejo de realizar, pero creemos que es mucho más interesante las reglas que podríamos sacar así que no las reglas que sacaríamos si tratáramos la información como en el Clústering (con tantos por ciento de cada atributo).</p>
<p>Así que el siguiente paso está claro.  Trabajar con un dataset de NL 200+ (ya estoy importando sólo quedan 52 horas XD) y ser menos ambiciosos con el número de atributos a usar y decidir qué cantidad de muestras mínimas necesitamos para ellos (haciendo el cálculo anterior del 3bet para todos ellos). En eso estamos ahora =)  ¿Ideas sobre qué atributos usar?</p>
<p>En el siguiente post, colgaré la preselección y el estudio de cada atributo con el número mínimo de muestras necesarias. A ver que os parece.</p>
<p><a title="New" href="http://jesusnubiola.com/data/report analisis poker online junio.pdf" target="_blank">Trabajo (report)</a></p>
<p><a title="Datasets" href="http://www.mixed-harvesters.com/stars.html" target="_blank">Fuente de los datos</a></p>
<p>Tutorial Weka <a title="Curso Weka I" href="http:/jesusnubiola.com/data/CursDoctorat-weka.pdf" target="_blank">I</a> y <a title="Tutorial Weka II" href="http://jesusnubiola.com/data/tutorialWeka.pdf" target="_blank">II</a></p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=92</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Cositas interesantes</title>
		<link>http://jesusnubiola.com/poker/?p=83</link>
		<comments>http://jesusnubiola.com/poker/?p=83#comments</comments>
		<pubDate>Wed, 22 Apr 2009 15:59:17 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Poker Stove]]></category>
		<category><![CDATA[Pokerazor]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=83</guid>
		<description><![CDATA[Este post será un compendio de varias noticias y links interesantes que he leído. Varios foreros de poker-red se han ofrecido a darme sus databases para colaborar con el proyecto. Es por eso que he creado una nueva sección en dónde quien quiera colaborar puede subir las manos. El link lo tenéis arriba al lado [...]]]></description>
			<content:encoded><![CDATA[<p>Este post será un compendio de varias noticias y links interesantes que he leído.</p>
<p>Varios foreros de <a title="poquer-red" href="http://poquer-red.com" target="_blank">poker-red</a> se han ofrecido a darme sus databases para colaborar con el proyecto. Es por eso que he creado una nueva sección en dónde quien quiera colaborar puede subir las manos. El link lo tenéis arriba al lado de Acerca del autor :) Por otro lado, también me han informado que en esta <a title="Recolección de manos" href="http://www.mixed-harvesters.com/stars.html" target="_blank">web</a> hay miles de manos gratuitas pertenecientes al 2007, lo que es una fantástica ayuda para empezar.</p>
<p>Más cosas.</p>
<p><span id="more-83"></span></p>
<p>El forero Klaudioz me ha recomendado que para calcular rango de manos y demás probabilidades relacionadas con el poker, pruebe el programa <a title="programa estadístico de cáculo" href="http://pokerazor.com/" target="_blank">pokerazor</a>. Aún no lo he examinado exhaustivamente pero por lo poco que he visto me parece más completo que el que usaba hasta entonces: <a title="http://www.pokerstove.com/" href="http://www.pokerstove.com/" target="_blank">pokerstove</a>. Así que si no lo conocais echadle un ojo porqué es muy interesante.</p>
<p>Por último recomendar una web de referencia para todo aquel que esté interesado en el mundo del poker online y la informática. Es un blog que sigo desde hace mucho tiempo y que imagino que muchos de vosotros conoceréis, pero por si a caso: <a title="Coding the Wheel" href="http://www.codingthewheel.com/" target="_blank">coding the wheel</a> (está en inglés).</p>
<p>Estoy preparando un par de posts sobre inteligencia artificial y sobre como intentaremos aprovechar su potencial para el poker online. También he empezado ya a usar el <a title="software Weka" href="http://www.cs.waikato.ac.nz/ml/weka/" target="_blank">Weka</a>, que es un conocido <a title="Software" href="http://es.wikipedia.org/wiki/Software">software</a> para <a title="Aprendizaje automático" href="http://es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico">aprendizaje automático</a> y <a title="Minería de datos" href="http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos">minería de datos</a> escrito en <a title="Lenguaje de programación Java" href="http://es.wikipedia.org/wiki/Lenguaje_de_programaci%C3%B3n_Java">Java</a> y desarrollado en la <a class="extiw" title="en:University of Waikato" href="http://en.wikipedia.org/wiki/University_of_Waikato">Universidad de Waikato</a>. Cuando tenga los primeros resultados (aunque sean muy pobres) prometo publicar un post.</p>
<p>Muchas gracias a todos y animaros a comentar que el google analytics me dice que haberlos haylos ;)</p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=83</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Valores estándares para estadísticas (NL)</title>
		<link>http://jesusnubiola.com/poker/?p=59</link>
		<comments>http://jesusnubiola.com/poker/?p=59#comments</comments>
		<pubDate>Wed, 15 Apr 2009 17:21:14 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Clustering]]></category>
		<category><![CDATA[Data Mining]]></category>
		<category><![CDATA[Weka]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=59</guid>
		<description><![CDATA[Removiendo por los foros de Poker he encontrado las stats que usa Silv3rd4v3 (conocido jugador de NL shortstack). En conreto se trata de las stats que él usa en el Holdem Manager. Me parecen un buen punto de partida para poder hacer la caracterización de cada usuario y determinar a qué perfil lo situamos. Vamos [...]]]></description>
			<content:encoded><![CDATA[<p>Removiendo por los foros de Poker he encontrado las stats que usa Silv3rd4v3 (conocido jugador de NL shortstack). En conreto se trata de las stats que él usa en el <a title="holdem manager" href="http://holdemmanager.net" target="_blank">Holdem Manager</a>. Me parecen un buen punto de partida para poder hacer la caracterización de cada usuario y determinar a qué perfil lo situamos.</p>
<p>Vamos allá:</p>
<p>config HUD</p>
<p>Name/NH<br />
VPIP/PFR/AF/WTSD<br />
Cbet/FCbet/RCbet/FcbetTurn<br />
Fbbs/Fsbs/ATS(orl)/OLS (openlim sb)<br />
3bet/F3bet/Winrate(bb/100)</p>
<ul>
<li>VPIP: <span style="color: red;">0-11 (tight)</span>, <span style="color: orange;">11 &#8211; 18 (semiloose)</span>, <span style="color: green;">18+ (loose)</span></li>
<li>PFR: <span style="color: red;">0-8 (Normal)</span>, <span style="color: orange;">8-14 (Algo agressivo)</span>, <span style="color: green;">14+ (demasiado agressivo)</span>. <em>Nota: Lo ideal es tener el pfr como mucho un 10%(con respecto al vpip) mas bajo. Claro q el pfr variara en fucnion del vpip q se tenga, pero contra mas distanciados esten, mas pasivo sera.</em></li>
<li>AF: <span style="color: green;">0-1 (pasivo)</span>, <span style="color: orange;">1-2 (normal)</span>, <span style="color: red;">2+ (agressivo)</span></li>
</ul>
<p><span id="more-59"></span></p>
<ul>
<li>WTSD: <span style="color: green;">0-27 (tight)</span>, <span style="color: orange;">27-35 (semiloose, aki es donde nos colocamos los SSS)</span>, <span style="color: red;">35+ (loose)</span>.</li>
<li>Cbet: <span style="color: green;">80-100 (frecuentemente)</span>, <span style="color: orange;">50-80 (habitualmente)</span>, <span style="color: red;">-50 (solo con mano)</span></li>
<li>Fcbet: <span style="color: green;">80-100 (frecuentemente)</span>, <span style="color: orange;">50-80 (segun le pille <img title="Tongue" src="http://www.pokerstrategy.com/smilies/tongue.gif" border="0" alt="Tongue" /> )</span>, <span style="color: red;">-50 (no se tira casi nunca)</span></li>
<li>Rcbet: <span style="color: red;">0-5 (solo lo hace con mano)</span>, <span style="color: orange;">5-15(lo hace con mano y a veces robando)</span>, <span style="color: green;">15+ (no creerle los raises <img title="Wink" src="http://www.pokerstrategy.com/smilies/wink.gif" border="0" alt="Wink" /> )</span>.</li>
<li>FcbetT: <span style="color: green;">75-100 (sino conecta se tira)</span>, <span style="color: orange;">50-75 (igual aun sigue pagando con proyecto)</span>, <span style="color: red;">-50 (pagara con cualkier cosa q lleve)</span>.</li>
<li>Fbbs: <span style="color: green;">80-100 (defiende poko)</span>, <span style="color: orange;">60-80 (defiende mirando vuestras stats)</span>, <span style="color: red;">-60 (lo q hace para q no le robes 1bb xDDD)</span></li>
<li>Fsbs:<span style="color: green;">80-100 (defiende poko)</span>, <span style="color: orange;">60-80 (defiende mirando vuestras stats)</span>, <span style="color: red;">-60 (lo q hace para q no le robes 0.5bb xDDD)</span>. <em>Nota: Si tiene muy desfasados los valores de BB y SB, es sintoma de q defiende mas por orgullo q por stats. Si veis q el tipo lo tiene muy desfasado, no usa programa de trakeo y seguramente sera un fishy <img title="Wink" src="http://www.pokerstrategy.com/smilies/wink.gif" border="0" alt="Wink" /> </em></li>
<li>ATS(orl): <span style="color: red;">0-15 (roba poko)</span>, <span style="color: orange;">15-30 (roba a menudo pero con cierto cuidado)</span>, <span style="color: green;">30+( AL LADRON!!!!! <img title="Big Grin" src="http://www.pokerstrategy.com/smilies/biggrin.gif" border="0" alt="Big Grin" /> <img title="Big Grin" src="http://www.pokerstrategy.com/smilies/biggrin.gif" border="0" alt="Big Grin" /> <img title="Big Grin" src="http://www.pokerstrategy.com/smilies/biggrin.gif" border="0" alt="Big Grin" /> )</span></li>
<li>OLSB: Este aun lo tengo en fase experimental, pero cuan mas alto es mas tiendo a robarle. Por lo q he ido observando, cuando me &#8220;openlimpeansb&#8221; jugadores relativamente tights ( Vpip bajo), al robarle se tiran con facilidad, en cambio con jugadores mas loose la cosa suele acabar mal, salvo q tengan un fold a cbet alto, la mano se acabara enmarañando.</li>
<li>3bet: <span style="color: red;">0-3 (rango standar, jj+ y AK)</span>, <span style="color: orange;">3-6 (seguramente 3betea en funcion de las stats, es relativamente tight pero si ve q puede 3betear de robo lo hace)</span>, <span style="color: green;">6+ (abusa en exceso, mas de una vez lo hara con manos debiles o incluso sin mano)</span>.</li>
<li>F3bet: <span style="color: green;">66-100 (foldea frecuentemente)</span>, <span style="color: orange;">50-66 (caera en al tentacion de pagaros con pp o ases relativamente bien acompañados)</span>, <span style="color: red;">-50 (es un fish)</span>.</li>
<li>Winrate: <span style="color: green;">0+ (ganador)</span>, <span style="color: red;">-0(perdedor)</span></li>
</ul>
<p><strong><span style="text-decoration: underline;">Apunte:</span></strong>: Para la primera fila (vpip&#8230;.) con 100 manos ya nos podemos hacer la idea, para las demás 300 mínimo para tener datos fiables <img title="Wink" src="http://www.pokerstrategy.com/smilies/wink.gif" border="0" alt="Wink" /> .</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</p>
<p>Mi idea inicial es preclasificar manualmente a los jugadores con los tres primeros atributos. Podríamos usar <a title="Fuzzy Logics" href="http://es.wikipedia.org/wiki/L%C3%B3gica_difusa" target="_blank">lógica difusa</a> y así trabajar con los valores más cómodamente (rojo, naranja, verde). En la clasificación manual tenemos 27 combinaciones posibles (tres al cubo), o lo que es lo mismo 27 <strong>posibles </strong>perfiles de jugador preclasificados. Que sean posibles no quiere decir que existan, ya que es probable que no exista un grupo de jugadores con un perfil: VPIP-rojo, PFR-rojo, AF-rojo.</p>
<p>Una vez organizados los jugadores en perfiles, el siguiente paso es extraer los que más dinero ganan (por ejemplo más de 2BB/100). Ahora ya tenemos los tiburones de cada perfil de jugador. <strong>Aquí es cuando entra en juego el Clustering.</strong> Mediante herramientas como <a title=" Weka" href="http://www.cs.waikato.ac.nz/ml/weka/">Weka</a> (le dedicaremos varios posts cuando lo sepa hacer servir ;) intentaremos ver qué grupos de atributos son similares en cada subperfil de ganador.</p>
<blockquote><p>-¿Por qué?</p>
<p>-Sencillo, si podemos averiguar qué relación existe entre un subperfil ganador y los atributos (no el VPIP, PFR y AGF sio los otros) que tenien en común, podemos hacer una comparación con nuestro juego y ver dónde tenemos leaks.  ¿Se va viendo la idea?</p></blockquote>
<p>Es importante remarcar que lo que pretendemos con esto es sacar <strong>información no trivial</strong> es decir que gracias al Clustering no supervisado podamos extraer conclusiones que a simple vista se nos escapan. Otra cosa es que inicialmente lleguemos a conclusiones obvias (que no estaría nada mal) ya que estaríamos en el buen camino y sólo nos faltaría perfilar más y añadir más atributos para hacer el Clustering. Todo esto es un proceso de prueba y error; ir añadiendo y sacando atributos a nuestro Data Set y ver como nos van quedando los grupos después de aplicar los algorismos de Clustering.</p>
<p>En próximos artículos explicaré un poco más las bases del Clustering y como programas como Weka nos pueden ayudar a intentar hacer minería de datos.</p>
<p>¿Qué os parecen los valores y la elección de estos atributos para empezar?  ¿Añadirías o quitarías alguno?</p>
<p>Muchas gracias.</p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=59</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Estado del arte</title>
		<link>http://jesusnubiola.com/poker/?p=36</link>
		<comments>http://jesusnubiola.com/poker/?p=36#comments</comments>
		<pubDate>Wed, 15 Apr 2009 00:40:11 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Data Mining]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=36</guid>
		<description><![CDATA[Buscando entre diferentes papers y demás he encontrado uno bastante interesante de la universidad Umea de Suecia, concretamente del departamento de ciencias de la computación. Su objetivo es ganar experiencia en data mining usando distintas técnicas y herramientas junto con largas bases de datos. Es decir, persiguen un objetivo muy similar al nuestro. Antes de [...]]]></description>
			<content:encoded><![CDATA[<p>Buscando entre diferentes papers y demás he encontrado uno bastante interesante de la universidad <a title="Universidad de Suecia" href="http://www.umu.se/english/?languageId=0" target="_blank">Umea de Suecia</a>, concretamente del departamento de <a title="Computer Science" href="http://www.cs.umu.se/" target="_blank">ciencias de la computació</a><a title="Computer Science" href="http://www.cs.umu.se/" target="_blank">n.</a></p>
<p>Su objetivo es ganar experiencia en <a title="Data Mining" href="http://es.wikipedia.org/wiki/Data_Mining" target="_blank">data mining</a> usando distintas técnicas y herramientas junto con largas bases de datos. Es decir, persiguen un objetivo muy similar al nuestro. Antes de seguir, un inciso.</p>
<blockquote><p>En el mundo del Poker es muy común usar el término &#8220;Data Mining&#8221; como sustituto de &#8220;recolección de datos&#8221;. Desde mi punto de vista es incorrecto. Aquí en el blog usaremos el término para hacer referencia a la extracción<strong> no trivial</strong> de <a title="Información" href="http://es.wikipedia.org/wiki/Informaci%C3%B3n">información</a> que reside de manera implícita en los <a title="Dato" href="http://es.wikipedia.org/wiki/Dato">datos</a>.</p></blockquote>
<p>Una vez aclarado el correcto uso de Data Mining debo decir que el paper es interesante ya que es una primera aproximación al problema de abordar la tarea de extraer conocimiento de las bases de datos, pero las conclusiones a las que llega son muy triviales y algo obsoletas (está escrito en 2005). Eran tiempos del Poker Tracker 2 y usan una base de datos de 170.000 manos.</p>
<p><img class="aligncenter size-full wp-image-43" title="vpipaggpaper20052" src="http://jesusnubiola.com/poker/http://jesusnubiola.com/poker/wp-content/uploads/2009/04/vpipaggpaper20052.jpg" alt="vpipaggpaper20052" width="580" height="234" /></p>
<p><span id="more-36"></span></p>
<p>Como vemos son conclusiones que pueden ayudar a un jugador a determinar qué porcentaje es el adecuado para ver el flop (VPIP) o el nivel de agresividad necesario para ser un jugador ganador. Está claro que éstos datos ya son <em>vox populi </em>en el mundo pokeril y para eso no necesitamos ninguna herramienta de data mining, pero por algo se empieza ;)</p>
<p>Al final los chicos del paper (por lo que deduce de su lectura) se curraron una interfaz web escrita en php que te predecía acciones preflop o en el flop. Por ejemplo: en el preflop te decía las posibles cartas -con probabilidades- que tenía tu rival basándose en las acciones que tú le habías descrito anteriormente (supongo). Pero eso nunca lo sabremos ya que el link que ponen en el paper está roto :(</p>
<p>Resumiendo. Los resultados de este paper muestran que la mejor estrategia es tener un VPIP entre 15-20 y a la vez ser muy agresivo (como bien dicen no han descubierto nada nuevo). La otra parte del proyecto trataba de calcular las probabilidades que un jugador tuviera una mano específica basándose en sus acciones anteriores. Concluyen que es fácil sacar conclusiones de nosotros mismos como jugadores del estilo &#8220;cuando hago raise en el flop tengo top pair el 39% de las veces&#8221; pero es muy difícil sacar conclusiones fiables de los oponentes con tan pocas manos (nada nuevo tampoco).</p>
<p>Como mencioné anteriormente, el estudio se quedo en una fase muy beta pero es interesante leerse las conclusiones que sacan del mismo para hacernos una idea de lo que nos espera.</p>
<p>Paper disponible aquí: <a href="http://jesusnubiola.com/poker/directuploads/datamining_report8.pdf">datamining_report</a></p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=36</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Acerca de la recolección de datos</title>
		<link>http://jesusnubiola.com/poker/?p=29</link>
		<comments>http://jesusnubiola.com/poker/?p=29#comments</comments>
		<pubDate>Fri, 20 Feb 2009 13:49:47 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[HHDealer]]></category>
		<category><![CDATA[hhSmithey]]></category>
		<category><![CDATA[Tracking de datos]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=29</guid>
		<description><![CDATA[vía poquer-red. La información es poder, en el póquer más si cabe todavía, y es por ello que minar o tener una buena base de datos de tus rivales es un punto básico par a incrementar tu winrate. Como os decía, el acto de minar hasta ahora era un proceso muy rudimentario, y consistia en [...]]]></description>
			<content:encoded><![CDATA[<p>vía <a href="http://poquer-red.com/blogs/simon/nuevos-servicios-datamining-suscripcion-simon-munoz" target="_blank">poquer-red.</a></p>
<p>La información es poder, en el póquer más si cabe todavía, y es por ello que minar o <strong>tener una buena base de datos de tus rivales es un punto básico par a incrementar tu winrate</strong>. Como os decía, el acto de minar hasta ahora era un proceso muy rudimentario, y consistia en dejar a tu ordenador rollo zombie toda la noche, como cuando dejabas el emule de joven (y no tan joven). Por decirlo de alguna forma, es poco eficiente.</p>
<p>De una necesidad, surge una idea de negocio, los servicios de datamining remoto. Básicamente consiste en una empresa que crea una estructura para minar a nivel industrial, por ejemplo, todas las manos, de todos los niveles, de una sala cualquiera. Luego revenden esa información por suscripción o en bloques ya sea semanal, mensualmente, etc&#8230;</p>
<p>Ahora bien, <strong>¿merece la pena pagar por algo así?</strong> Por mi parte no tengo ninguna duda, pero es que además estamos hablando de un coste realmente ridículo. Por ejemplo, en una de las páginas que os voy a comentar, suscribirse para recibir unas 600.000 manos al mes de <span class="glossary-term"><acronym title="No Limit 100: El número indica el buy in máximo, en este caso se trata de No Limit, con la ciega grande de $1">NL100</acronym></span>$ cuesta 10$&#8230; sólo la energía que consumiría tu ordenador en una semana ya lo hace rentable (por no hablar de que no ibas a minar ni la sexta parte de manos).</p>
<p><span id="more-29"></span></p>
<p>Ahora bien, <strong>¿es legal?</strong> Sí y no. Hay salas que explícitamente prohiben el datamining cuando no estás sentado a la mesa, como <a class="enlace_texto_sala" rel="nofollow" href="http://poquer-red.com/ir/pokerstars">PokerStars</a> o ^EverestPoker, pero otras salas/redes no. Por ejemplo, <a class="enlace_texto_sala" rel="nofollow" href="http://poquer-red.com/party-poker">Party Poker</a>, <a title="iPoker" href="http://www.ipoker.com/">iPoker</a>, o <a class="enlace_texto_sala" rel="nofollow" href="http://www.fulltiltpoker.com/?key=MDAwMDA0NDMwMDAwNkM2QjIwMzI0MDI0MDAwMDAwMDA-">Full Tilt Poker</a>. Por lo tanto, es legal para las segundas, pero no para las primeras.</p>
<p><strong>¿Es lícito? </strong>Mientras no hagas nada que vaya en contra de las reglas de la sala, no hay ningún problema. Es obvio que tener miles de manos de tus rivales te da una ventaja inherente sobre ellos, pero esta información está al alcance de cualquiera. Si no se suscribe, no hace datamining, o no utiliza los programas estadísticos, es su problema, no el tuyo. Otra cuestión es si es lícita la existencia misma de estos programas, pero eso ya es otra historia.</p>
<p>Actualmente, hay dos páginas que ofrecen este servicio, <a href="http://www.hhdealer.com/member.php">HHDealer</a>, que sólo mina sitios legales (Party, FTP e <a title="iPoker Network" href="http://www.ipoker.com/">iPoker</a>), y <a href="http://www.hhsmithey1.com/registration.php">hhSmithey</a> (Party, FTP, Stars y Absolute).</p>
<p>El problema es que justo <a href="http://www.hhdealer.com/member.php">HHDealer</a> se centra en los niveles más bajos (pueden haber 600-700K de <a class="glossary-term" href="http://poquer-red.com/glosario/abreviaturas#term323"><acronym title="No Limit 100: El número indica el buy in máximo, en este caso se trata de No Limit, con la ciega grande de $1">NL100</acronym></a>, pero sólo 200-300K de NL1000$), pero aún así, creo que por 30$ merece la pena.</p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=29</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cacti</title>
		<link>http://jesusnubiola.com/poker/?p=26</link>
		<comments>http://jesusnubiola.com/poker/?p=26#comments</comments>
		<pubDate>Fri, 20 Feb 2009 13:35:06 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[cacti]]></category>
		<category><![CDATA[Data Mining]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=26</guid>
		<description><![CDATA[Cacti es una completa solución de graficado en red, diseñada para aprovechar el poder de almacenamiento y la funcionalidad de graficar que poseen las RRDtool. Esta herramienta, desarrollada en PHP, provee un pooler ágil, plantillas de gráficos avanzadas, múltiples métodos para la recopilación de datos, y manejo de usuarios. Qué es una RRDtool? RRDtool es [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Cacti</strong> es una completa solución de graficado en red, diseñada para aprovechar el poder de almacenamiento y la funcionalidad de graficar que poseen las RRDtool. Esta herramienta, desarrollada en PHP, provee un pooler ágil, plantillas de gráficos avanzadas, múltiples métodos para la recopilación de datos, y manejo de usuarios.</p>
<h3><span class="mw-headline">Qué es una RRDtool?</span></h3>
<p>RRDtool es el acrónimo de Round Robin <span class="mw-redirect">Database</span> tool, o sea que se trata de una herramienta que trabaja con una BD que maneja Planificación Round-robin. Esta técnica trabaja con una cantidad fija de datos y un puntero al elemento actual. El modo en que trabaja una base de datos utilizando Round Robin es el siguiente; se trata la BD como si fuera un círculo, sobrescribiendo los datos almacenados, una vez alcanzada la capacidad de la BD. La capacidad de la BD depende de la cantidad de información como historial que se quiera conservar.</p>
<p><span id="more-26"></span></p>
<h3><span class="mw-headline">Qué tipo de datos pueden ser almacenados en una RRD?</span></h3>
<p>Cualquiera, siempre que se trate de una serie temporal de datos. Esto significa que se tiene que poder realizar medidas en algunos puntos de tiempo y proveer esta información a la RRDtool para que la almacene.</p>
<p>Un concepto ligado a las RRDtool es el de <span class="mw-redirect">SNMP</span>, acrónimo de Simple Network Management Protocol. Este protocolo puede ser usado para realizar consultas a dispositivos acerca del valor de los contadores que ellos tienen (ej: una impresora). El valor obtenido de esos contadores es el que queremos guardar en la RRD.</p>
<h3><span class="mw-headline">Qué puedo hacer con esta herramienta?</span></h3>
<p>Puedo, a través de Cacti , representar graficamente los datos almacenados en la RRD: uso de conexión a internet, datos como temperatura, velocidad, voltaje, número de impresiones, etc. La RRD va a ser utilizada para almacenar y procesar datos recolectados vía <span class="mw-redirect">SNMP</span>.</p>
<p>En definitiva, para hacer uso de una RRDtool, lo que se necesita es un sensor para medir los datos y poder alimentar al RRDtool con esos datos. Entonces, la RRDtool crea una base de datos, almacena los datos en ella, recupera estos datos y basandose en ellos, Cacti crea gráficos en formato <span class="mw-redirect">PNG</span>.</p>
<p><a href="http://www.cacti.net/">http://www.cacti.net/</a></p>
<p><a href="http://www.cacti.net/" target="_blank">http://es.wikipedia.org/wiki/Cacti</a></p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=26</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Documentación sobre PostgreSQL</title>
		<link>http://jesusnubiola.com/poker/?p=24</link>
		<comments>http://jesusnubiola.com/poker/?p=24#comments</comments>
		<pubDate>Thu, 19 Feb 2009 18:56:13 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[PostgreSQL]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=24</guid>
		<description><![CDATA[http://www.enterprisedb.com/learning/overview.do]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.enterprisedb.com/learning/overview.do" target="_blank">http://www.enterprisedb.com/learning/overview.do</a></p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=24</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Documentos sobre  PokerTracker y su BBDD</title>
		<link>http://jesusnubiola.com/poker/?p=18</link>
		<comments>http://jesusnubiola.com/poker/?p=18#comments</comments>
		<pubDate>Thu, 19 Feb 2009 17:05:37 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[BBDD]]></category>
		<category><![CDATA[Poker Tracker]]></category>
		<category><![CDATA[PostgreSQL]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=18</guid>
		<description><![CDATA[Toda la documentación sobre PokerTracker. En ella están relatada la estructura de la base de datos así como manuales de instalación. http://www.pokertracker.com/products/PT3/docs/]]></description>
			<content:encoded><![CDATA[<p>Toda la documentación sobre PokerTracker. En ella están relatada la estructura de la base de datos así como manuales de instalación.</p>
<p><a href="http://www.pokertracker.com/products/PT3/docs/" target="_blank">http://www.pokertracker.com/products/PT3/docs/</a></p>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=18</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Links interesantes</title>
		<link>http://jesusnubiola.com/poker/?p=11</link>
		<comments>http://jesusnubiola.com/poker/?p=11#comments</comments>
		<pubDate>Wed, 18 Feb 2009 23:45:06 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Holdem Manager]]></category>

		<guid isPermaLink="false">http://jesusnubiola.com/poker/?p=11</guid>
		<description><![CDATA[Fórmulas para cada stat de Holdem Manager (en formato HM) http://www.holdemmanager.net/forum/showthread.php?t=3595 Manual para hacer reports propios en HM. http://www.holdemmanager.net/forum/showthread.php?t=282 The Cygnus project, proyecto de un tal Cygnus que se encontró con el mismo problema que yo (no tener bien definida la estructura de la BBDD que usa HM) y lanzó un proyecto en los foros [...]]]></description>
			<content:encoded><![CDATA[<ul>
<li>Fórmulas para cada stat de Holdem Manager (en formato HM)</li>
</ul>
<p><a href="http://www.holdemmanager.net/forum/showthread.php?t=3595" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=3595</a></p>
<ul>
<li>Manual para hacer reports propios en HM.</li>
</ul>
<p><a href="http://www.holdemmanager.net/forum/showthread.php?t=282" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=282</a></p>
<p>The Cygnus project, proyecto de un tal Cygnus que se encontró con el mismo problema que yo (no tener bien definida la estructura de la BBDD que usa HM) y lanzó un proyecto en los foros para ir averiguando como estaba hecha. Tengo que ponerme en contacto con él para saber en que se basa su trabajo.</p>
<ul>
<li><a href="http://www.holdemmanager.net/forum/showthread.php?t=4370&amp;highlight=cygnus" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=4370&amp;highlight=cygnus</a></li>
<li><a href="http://www.holdemmanager.net/forum/showthread.php?t=4367&amp;highlight=cygnus" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=4367&amp;highlight=cygnus</a></li>
<li><a href="http://www.holdemmanager.net/forum/showthread.php?t=4168&amp;highlight=cygnus" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=4168&amp;highlight=cygnus</a></li>
<li><a href="http://www.holdemmanager.net/forum/showthread.php?t=4164&amp;highlight=cygnus">http://www.holdemmanager.net/forum/showthread.php?t=4164&amp;highlight=cygnus</a></li>
<li><a href="http://www.holdemmanager.net/forum/showthread.php?t=4167&amp;highlight=cygnus" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=4167&amp;highlight=cygnus</a></li>
<li><a href="http://www.holdemmanager.net/forum/showthread.php?t=4161&amp;highlight=cygnus" target="_blank">http://www.holdemmanager.net/forum/showthread.php?t=4161&amp;highlight=cygnus</a></li>
<li><a href="http://www.holdemmanager.net/forum/search.php?searchid=58830" target="_blank">http://www.holdemmanager.net/forum/search.php?searchid=58830</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://jesusnubiola.com/poker/?feed=rss2&amp;p=11</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
