Есть библиотека по обработке изображений. Хотелось бы ее оптимизировать с помощью MMX.
NASM фришный асм с любым фришным линкером. но тебе придется сделать отдельные обертки - рапперы для каждого входа-энтри в твою библиотеку для разных ОС... Но смысл это имеет только ессно для х86 с MMX