Är grodan utanför dammen eller dammen utanför grodan?
När vi beskriver ett föremåls placering i en bild, använder vi oss av beskrivningar som dess fysiska placering och förhållandet till andra saker i bilden. Men hur ska datorer lära sig att till exempel föredra beskrivningen ”grodan är utanför dammen” snarare än ”dammen är utanför grodan”? I sin avhandling undersöker Mehdi Ghanimifard hur artificiella neurala nätverk lär sig vilken information som är relevant för rumsliga beskrivningar.