Duplikált kérdések

Kíváncsiság képpen készítettem egy SQL lekérdezést, mellyel a 'Legyen Ön is Milliomos!' Facebook játékban lévő duplikált kérdéseket céloztam meg.

A kérdés és a jó válasz mezők string komparálásán alapuló lekérdezés sajnos viszonylag sok duplikált kérdés párt eredményezett.

A duplikált kérdésekkel kapcsolatos problémát nyilvánvalóan szerettem volna valamilyen módon rendezni, így végül a következő döntés született (a műveletek sorrendje fontos!):

Töröljük az egyes kérdés párok azon tagját,

  1. amelynek a megjegyzés mezője nincs kitöltve, de csak akkor, ha a másik kérdésnél ez a mező nem üres (a megjegyzés mező kitöltöttsége mindenképpen manuális ellenőrzést jelent, mely a kérést tartalmi szempontból is vizsgálta).
  2. amelyiket határozottan kevesebbszer tett fel a játék (a nehézségi szint beállítását célzó statisztikai ok).
  3. amelyik előbb szerepel az adatbázisban. (eddigre már csak kevés kérdés volt érintett, melyek esetében egyéb lényegi szempont nem merült fel)

Az adatbázis konszolidáció eredményeképpen összesen 128 kérdés került törlésre, ami az egész adatbázisnak csupán mintegy 2%-át jelenti.