Creo que podéis empezar por leer este fantástico artículo de Brian Long en la web de Embarcadero, donde está explicado con detalle (incluyendo trozos de código) todo lo necesarios a saber sobre este tema. Tanto para reconocimiento de voz, como para síntesis de voz.
http://edn.embarcadero.com/article/29583#SR
Al final, tenéis que usar la API de windows que ya hay al respecto.
Microsoft Speech API (SAPI) 5.4
https://msdn.microsoft.com/en-us/lib...(v=vs.85).aspx
Deberéis importarla desde Delphi y a partir de ahí empezar a trabajar con ella.
http://www.exceletel.com/support/wht...ech/delphi.htm