Вопрос Есть ли инструмент для удаления всех гиперссылок из html-файла?


Есть ли способ сделать это в Ubuntu? Я читал, что это возможно в php, но я вообще не знаком с php.


4
2018-05-29 14:33


происхождения




ответы:


Вы можете использовать sed для этого, но он будет работать только для ссылок, которые находятся в одной строке в html-коде.

Обновить:

Проклятое жадное регулярное выражение! ;) Это должно работать сейчас!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>


3
2018-05-29 14:49



Это странно! Удаление всех предложений после привязки ссылки в абзаце до следующего привязки ссылки, который не удаляется. Оставлять много ссылок как есть. :( - 22lk94k943 only
Можете ли вы дать образец файла? - ortang
Конечно, почему бы и нет. skydrive.live.com/redir?resid=98CCEEFEF56EFF2A!118 - 22lk94k943 only
Я обновил свой ответ - ortang
Черт! Он работает как нож на сыре. Большое спасибо. Это будет очень познавательно, если вы можете добавить описание «Жадное регулярное выражение» к ответу. - 22lk94k943 only


Зависит от того, что вы пытаетесь сделать:

Если на вашем компьютере есть куча файлов, и вы хотите удалить ссылки, используйте что-то вроде скрипта perl для удаления <a ...> ... </a> теги. Вы можете удалить другие теги (или даже все теги) аналогичным образом. С помощью подходящих вариантов соответствия шаблону этот подход может обрабатывать теги, разделенные на несколько строк. (Он очень изящный, но детали не помещаются в поле этого сообщения).

Если вы пытаетесь просматривать файлы на каком-либо веб-сервере, используя firefox (или другой браузер), какой-то сценарий greasemonkey, который автоматически изменяет страницы «на лету», прежде чем показывать их, может быть тем, что вы хотите.


1
2018-05-29 14:50