मैं पहले html स्रोत से यूआरएल की सूची को संक्षिप्त करने के लिए नीचे दिए गए कोड का उपयोग करने में सक्षम रहा हूं, लेकिन किसी कारण से यह इस विशिष्ट उदाहरण के लिए काम नहीं कर रहा है।
ग्रेप:
grep -1 box-download shareit1.txt|sed 's/<a/\/n/'|sed 's/href/\/n/'|grep http|cut -d\" -f2>> shareit2.txt
यूआरएल:
<div class="box-download">
<a data-no-file="0" title="SHAREit free download" href="http://gsf-cf.softonic.com/c98/1a8/173dd01ec9001985d81eb5f2023b03280c/LenovoShareIt-win.exe?SD_used=0&channel=WEB&fdh=no&id_file=69703978&instance=softonic_en&type=PROGRAM&Expires=1444364906&Signature=SdKSfTDHY4dG6HVu2--lqt8lRbGK9S1opIDZiSNwvggAAAXB3hESz1G1Y00rU5iLGY5lai0YOJBXhE4y6gvL4uQvCV4U5jzLDU9TmFTxe4xNDrEmkSC95LyGdGSudQKfrWdD06gBlVrqE49AeeotENtdA3SpkmfQGGd1tnjS138_&Key-Pair-Id=APKAJUA62FNWTI37JTGQ&filename=LenovoShareIt-win.exe" id="download-button" class="button-main-download-xl"
data-ua="#c,#l,a=Download,downloadType=HostedDownload"
>
<strong>Free Download
<span>Safe download</span>
</strong>
<i class="icon-download-alt"></i>
</a>
मदद की सराहना करें।
lynx -force_html -dump --listonly shareit1.txt
।
^
), संख्या, वोट डाउन ( v
) और स्वीकार ( ✓
)। आप किसी भी जवाब के लिए वोट डाल सकते हैं। यदि आपको लगता है कि उत्तर अच्छी तरह से लिखित और सहायक है, तो यह वोट के उपयोग के योग्य है ^
। आप उत्तर भी स्वीकार कर सकते हैं, लेकिन प्रश्न के लिए केवल एक। ✓
उस उत्तर के लिए है जो सभी की उच्चतम गुणवत्ता है या आपकी समस्या को सीधे हल करता है।
grep -Poz 'href="\K[^"]*' file.html