Для пустой страницы toHtml вернет
<html><head></head><body></body></html>
(что нифига не емпти).
как правильно его очистить?
Если надо очистить только визуальное представление контента (т.е. не надо заморачиваться на очистку нетворкменеджера/кук и т.п.) - думаю, достаточно просто