Manu Pitkänen
13. syyskuuta, 2016 13:28
Tekoälystä ja syväoppimisesta on tullut keskeinen trendi tietotekniikan kehittymisessä viimeisen vuoden aikana ja tarvittava laskentateho on kasvanut samassa ajassa myös huimasti. Trendiin varhaisessa vaiheessa mukaan lähteneen Nvidian mukaan syväoppimisen sovelluskohteissa tarvitaan jo kymmenkertainen määrä laskentatehoa viime vuoteen verrattuna.
Laskentatehotarpeeseen Nvidia on esitellyt uudet Pascal-arkkitehtuuriin perustuvat Tesla P40- ja Tesla P4-ohjaimet. Transistoreita niistä löytyy 12 (P40) ja 7,2 miljardia (P4) kappaletta, mikä on varsin iso hyppäys edellisen sukupolven Tesla M40- ja M4-ohjaimista (8 ja 3 miljardia transistoria).
Transistoreiden määrän kasvun ja uuden arkkitehtuurin käyttöönoton myötä myös suorituskykykin on kasvanut, FP32-tarkkuudella mitattuna Tesla P40 yltää 12 TFLOPSin ja Tesla P4 5,5 TFLOPSin suorituskykyyn (M40 ja M4: 7 TFLOPS, 2,2 TFLOPS). Laskennallisesti uutta on INT8-käskykannat pienempää tarkkuutta ja suurempaa suorituskykyä vaativia tehtäviä varten.
Ohjaimien lisäksi Nvidia esitteli TensorRT-päättelymoottorin, jonka avulla kehittäjät voivat hyödyntää valmiiksi opetettuja päättelymalleja omissa tuotteissaan. DeepStream-kehitystyökalujen avulla palvelukehittäjät voivat vuorostaan hyödyntää tekoälyä analysoidessaan videomateriaalien sisältöä.