Magyarországi Web Konferencia 2008

Web Spam: manipulált tartalom a Világhálón

Szervező

Neumann János Számítógép-tudományi Társaság Webalkalmazások Fejlesztése Szakosztály

Szakmai partnerek

W3C MI Weblabor

Infrastruktúra

phpHOST

A keresők találati oldalain elfoglalt előkelő (első) helyezés nagy forgalmat és így üzleti lehetőséget biztosít az adott weboldal üzemeltetőjének. Emiatt egyes weboldal üzemeltetők olyan technikákat (spamdexing) alkalmaznak, amelyek a felhasználók számára semmiféle többletszolgáltatást nem nyújtanak, egyetlen céljuk, hogy a céloldal helyezését a kereső rangsorokban manipulálják.

Az előadás során bemutatjuk a leggyakrabban alkalmazott manipulációs módszereket, illetve a Web spam szűrésére világszerte tett erőfeszítéseket.  Külön kitérünk a HTTP és a HTML protokollok által adott lehetőségekkel (ágens azonosítás, nehezen feldolgozható script tartalmak, stb.) való visszaélési lehetőségekre.

Kulcsszavak

keresőrendszerek, manipuláció, gépi tanulás

Benczúr András, Siklósi Dávid

 fotója  fotója Benczúr András 2007-ben szerezte Ph.D. fokozatát a Massachusetts Institute of Technology-n alkalmazott matematikából. Azóta az MTA SZTAKI Informatika Kutató Laboratórium munkatársa. 2000-ben alapította a laboron belül az Adatbányászat és Webkeresés Kutatócsoportot, amelyben ma 3 vezető kutató, 3 posztdoktor és számos Ph.D. hallgató tevékenykedik és fejleszt. A kutatócsoport eredményei egyedi megoldásokat biztosítanak extrém méretű rendszerek (nagy belső hálózatok, nagyforgalmú Web-portálok), illetve a magyar nyelvű információkeresés számára. A csoport hazai és nemzetközi együttműködésben szociális hálózatok, biztonsági incidensek és ügyféladatok elemzését, illetve a Web spam szűrését végzi; eredményeit a 2006/07 akadémiai évben Yahoo! Faculty Research Grant támogatással ismerték el, illetve a KDD Cup 2007 győztes megoldása is a csoport nevéhez fűződik. A végzett doktoranduszok közül már öten dolgoznak a legnagyobb Internetes keresőcégek (Google, Yahoo) kutató-fejlesztő központjaiban.

Időrendi program Váltás tematikusra

Az alábbiakban a konferencia időrendi programja olvasható. A "From level 2 to level 3: advanced layout in CSS" és a "How Java becomes agile riding Rhino" című előadások kivételével minden előadásunk magyar nyelvű.

IdőTerem / Programpont
 BudapestPrágaVarsóMoszkva
09.00 10.00Regisztráció az előtérben
10.00 10.45A web jövőjeJava érdekességek: JavaFXFrom level 2 to level 3: advanced layout in CSSFelhaszáló központú és föderatív azonosítási megoldások web alkalmazásokban*
10.45 11.00Szünet
11.00 11.45GWT: Kompromisszumok nélküli AJAX - professzionális fejlesztő környezettel*Hackerek reggelije*SOA-alapú interoperábilitás a nemzetközi e-közigazgatásbanHatékony webes alkalmazásfejlesztés ASP.NET 3.5 és Visual Studio 2008 alapokon*
11.45 13.00Ebédszünet
13.00 13.45Mysql adatbázis technikákHD media használat a weben*Hatékony keresés a szemantikus világhálónMikroformátumok, avagy a kisbetűs szemantikus web*
13.45 14.00Szünet
14:00 14:45Silverlight 2 technológiai áttekintésUWA: widget fejlesztési irányelvek*Web Spam: manipulált tartalom a VilághálónSun open source technológiái
14.45 15.00Szünet
15:00 15:45Webfejlesztői karrierek 2008-ban - Mi várható?*Robosztus Webalkalmazás Fejlesztés F#-alParadigmatikus relációk tipológiája avagy Ontológia és tezaurusz egyesítéseOpenESB, szabványos és nyílt forráskódú SOA
15.45 16.00Szünet
16:00 16:45ExtJS 2 - Táblázat mánia*Ajaxos fejlesztés NetBeansben jMakivalMobil Web-böngészők Windows Mobile-on, Symbian-on és BlackBerry-n – a három fő mobil operációs rendszerenHow Java becomes agile riding Rhino*
16.45 16.50Szünet
17:00 17:45PHP, ahogy még nem csináltad*   
17.50 18.00Zárszó a Budapest teremben