Inicio | Pedro Santana |  RSS  Mi tumblelog  Mis photos  Mi CV

 

Archivo de la categoría ‘Web Semantica’

Ontologías: qué son y para qué sirven

Ontologías: qué son y para qué sirven

¿4 Mentiras sobre posicionamiento en Google?

Jesús en su blog ha puesto un post bastante interesante, ¿pero porque interesante? veamos, el post en cuestión se llama 4 Mentiras sobre posicionamiento en Google, hay que leerlo antes de continuar con este :P

Realmente es un post muy debatible, ya que se esta basando en suposiciones no en la teoria (y practica) de lo que es la recuperación de información.

Recuerdo un post similar en jesusbet.net y el debe de recordar un comentario similar a este :) lamentablemente jesusbet.net ya no existe y no puedo tomar de ahi mi respuesta, pero vamos a tratar de responder, no con el animo de pelea si no con el afan de no confundir a los lectores de blogs.

Jesús esta confundiendo, PageRank no tiene NADA que ver con lo que dice de la búsquedas, es decir el pagerank no es sobre la semántica, es decir en su ejemplo, si tu buscas Jesus el hecho de que el tenga 5 de PR y la otra web tenga 4 no significa que su sitio deba de salir primero en esa búsqueda ya que el contenido semántico no es el PR, el PageRank es:

PageRank relies on the uniquely democratic nature of the web by using its vast link structure as an indicator of an individual page’s value. In essence, Google interprets a link from page A to page B as a vote, by page A, for page B. But, Google looks at more than the sheer volume of votes, or links a page receives; it also analyzes the page that casts the vote. Votes cast by pages that are themselves “important” weigh more heavily and help to make other pages “important.”

Por lo que importancia no tiene nada que ver con contenidos!!

Sobre enlaces recíprocos, ahora que Google ha terminado su actualización conocida como ‘Jagger’ ya se sabe que han empezado a detectarlos e incluso hay quienes aseguran que ya no los toma en cuenta o que no se dejan de tener en cuenta totalmente, pero sí que Google los detecta ahora con más facilidad.

Sobre los enlaces salientes, veamos un poco de matemáticas, citando a Kirai la formula del PR es:

PageRank(A)=(1-0.85) + 0.85*(PageRank(T1)/C(T1)) + 0.85*(PageRank(T2)/C(T2))

donde:

* -PR(A) significa que vamos a calcular el PageRank de la web A.
* -T1, T2, T3 … Tn son las páginas web que tienen un link hacia la página web A.
* -d es una constante que suele vale 0.85
* -C(T1), C(T2), C(T3) … C(Tn) son el número de links al exterior de las webs T1,T2,T3 etc…

si:

-Página Web T1 (PageRank = 5):
-Link hacia A.
-Link a slashdot
-Link a barrapunto
-Link a la nasa
-Página Web T2 (PageRank=3):
-Link hacia A
-Link a google

Observa que la página T2 con PageRank 3 nos beneficia algo más que T1 con PageRank 5 porque no tiene tantos links al exterior.

Sobre adwords, en eso si tiene toda la razón.

Combatiendo el Web Spam con TrustRank

Desde que Google propuso prevenir los comentarios spam en weblogs, foros, wikis, etc., usando rel=”nofollow” también se ha estado escuchando mucho sobre TrustRank una tecnología propuesta en Standford por Zolt´an Gyongyi, Hector Garcia-Molina y Jan Pedersen este último de Yahoo!

Friend of a friend o cómo construir redes sociales en la Web Semántica

Cada vez me sorprendo más con las aplicaciones de la web semántica, en esta ocasión gracias a Web Semántica Hoy me encontré con el artículo FOAF: friend of a friend o cómo construir redes sociales en la Web Semántica en el cual hablan de FOAF.

¿Qué es FOAF?

FOAF es una aplicación basada en XML (lenguaje de marcado extendible), RDF (marco de trabajo para la descripción de recursos) y OWL (lenguaje de ontologías web), tecnologías recomendadas por el W3C. Leandro Mariano (inkel) explica que se trata de un archivo XML (en realidad, RDF escrito en XML) con el cual se describen personas, documentos o cualquier cosa. En ese archivo que desde ahora llamaremos FOAF, indicamos a qué personas conozco, quiénes son mis amigos y quiénes no, cuáles son mis proyectos actuales y anteriores, qué grado de interés tengo por unos temas u otros… casi todo puede ser definido. Para Dan Brickley (danbri), uno de los cofundadores del proyecto FOAF junto con Libby Miller (libby), la idea es muy simple, un archivo que puede ser interpretado por un ordenador, tecnología que profundiza en la Web Semántica. Una vez que dispones de tales archivos puedes navegar a lo largo de todos los documentos legibles por ordenadores que se encuentran en la web y dispones de una base inmensa para extraer la información que necesitas y crear tu propia base de datos a medida.

Por lo pronto ya he creado mi archivo FOAF usando FOAF-a-matic, ¿Quien más tiene el suyo?.

Cuidado!!, nuevo virus

Una nueva variante de la familia Dumaru de gran difusión, fue encontrada
el 24 de Enero del 2004, pertenece a una familia de gusanos de correo masivo,
con la característica de robar información de la PC a través
de varios “backdoors”.

Desinfección Manual:

Es manual y consiste de los siguientes pasos:

1.- Elimine la entrada al registro:

HKLMSoftwareMicrosoftWindowsCurrentVersionRunload32

2.- Elimine los archivos:

%SysDir%l32x.exe

%SysDir%vxd32v.exe

dllxw.exe de la carpeta de inicio

3.- Rescriba el archivo system.ini

[Boot]

Shell=explorer

4.- Reinicie la computadora

Funcionamiento:

Infección del Sistema:

Al ejecutarse Dumaru.Y instala varias copias de si mismo en la PC:

- l32x.exe en la carpeta de Sistema de Windows y se añada al registro
así:

HKLMSoftwareMicrosoftWindowsCurrentVersionRunload32

- dllxw.exe se copia a la carpeta de Inicio.

- vxd32v.exe se copia a la carpeta de Sistema de Windows y se añade
al archivo “System.Ini”:

[Boot]

Shell=explorer vxd32v.exe

Daño que ocasiona:

Al robar información a través de programas de tipo “Back
Door”, se podrá obtener infamación sensible del “ClipBoard”,
Datos Protegidos, información sensible de los usuarios de www.e-gold.com.
Lo anterior lo logra a través de un servicio de FTP que provee a través
del puerto 10000 acceso sin restricciones a la máquina infectada.

Propagación por Correo:

Dumaru.Y utiliza su propio programa de SMTP para enviarse. Su SMTP utiliza
el servicio “direct name” en la víctima para no depender
del servicio propio que tenga el usuario.

Para obtener las direcciones de correo el gusano busca en todos los directorios
de la PC y archivos que pudieran contener direcciones de correo .htm , .wab ,
.html ,.dbx , .tbb , .abd

Presentación:

Llega un correo así:

Desinfección automática:

F-secure detecta y elimina este gusano con la actualización del 24 de
Enero del 2004.