A projekt célja egy olyan bioinformatikai szolgáltató központ létrehozása, mely az eddigi bioinformatikai megoldások műszaki hátrányait kiköszöbülve, azoknál alacsonyabb áron tud szolgáltatást nyújtani.
A feladat két munkaszakaszon keresztül valósul meg. Célja új algoritmusok kidolgozása, melyek szükségesek a de novo összeépítés, páros illesztés (pairwise alignment) és a referencia genomra térképezés feladatok támogatásához. A többi tervezett menüpont esetében nyilvánosan elérhető algoritmusok között találhatóak olyanok, melyek biztosítják az adott utasítás hatékony működését, de az említett három menüpont esetében szükség van ilyen fejlesztésre, mivel a jelenleg elérhető algoritmusok nem elég hatékonyak, és nem képesek kihasználni a nagyobb erőforrásokkal rendelkező számítógépek nyújtotta kapacitásokat. A projekt egyik legfőbb tudományos eredménye az új algoritmusok létrehozása lesz. Olyan öntanuló algoritmusokat alkalmazása a cél, melyek a lehető legszélesebb tartományban képesek lesznek kihasználni a hardverek kínálta erőforrásokat. A különböző algoritmusokat kombináljuk az optimális eredmény elérése érdekében. Elsőként az adatok előszűrésére gyorsabb, de „felületesebb” algoritmusokat használunk, majd az adatok további szűrőzését lassabb, de pontosabb algoritmusok fogják végezni. Az algoritmusokat teszteljük saját illetve nyilvánosan elérhető genomikai adatbázisokon.
A feladat további eleme a módszertanok kidolgozása a de novo szekvenálás és a (16SrDNS és shotgun) metagenomika esetén. E feladat teljesítése során elsőként lérehozzuk az automatizált „pipeline-t”, majd teszteljük működését saját és nyilvánosan elérhető eredményeken. A pipeline létrehozása során részben saját eddigi tapasztalatainkra, részben szakirodalmi adatokra fogunk építeni.
A projekt a Nemzeti Kutatási Fejlesztési és Innovációs Hivatal támogításával valósul meg (KFI_16-1-2016-0171).