Pongo un enlace a una página muy buena para aprender a utilizar las funciones del GDI de windows. El tutorial es para C++, pero las funciones se utilizan exactamente igual en Delphi.
Delphi simplifica muchísimo el uso del GDI con objetos como el TCanvas, Tbitmap, etc, pero si quieres optimizar tanto como sea posible (aunque usando el scanline ya haces el 95% de la optimización) tienes que usar el GDI directamente. La idea es trabajar en memoria todo lo que no se pueda hacer con el GDI por que tendrás control total sobre tus bits y sólo para mostrar en pantalla el resultado final usar el GDI.
http://www.winprog.org/tutorial/index.html