Была поставлена следующая задача: из невалидного html-документа(кусок сохраненной страницы) достать все ссылки(по атрибуту href).
Написано 10 строк кода на PHP, использована сторонняя библиотека для работы с DOM.
Скрипт отработал полсекунды, вытащив 322 ссылки. Функционал скрипта может быть значительно расширен.