वेब से html सामग्री कैसे प्राप्त करें?


123

Webview से html कोड प्राप्त करने की सबसे सरल विधि कौन सी है? मैंने स्टैकओवरफ्लो और गूगल से कई तरीकों की कोशिश की है, लेकिन एक सटीक तरीका नहीं खोज सकता। कृपया एक सटीक तरीका बताएं।

public class htmldecoder extends Activity implements OnClickListener,TextWatcher
{
TextView txturl;
Button btgo;
WebView wvbrowser;
TextView txtcode;
ImageButton btcode;
LinearLayout llayout;
int flagbtcode;
public void onCreate(Bundle savedInstanceState)
{
            super.onCreate(savedInstanceState);
                setContentView(R.layout.htmldecoder);

    txturl=(TextView)findViewById(R.id.txturl);

    btgo=(Button)findViewById(R.id.btgo);
    btgo.setOnClickListener(this);

    wvbrowser=(WebView)findViewById(R.id.wvbrowser);
    wvbrowser.setWebViewClient(new HelloWebViewClient());
    wvbrowser.getSettings().setJavaScriptEnabled(true);
    wvbrowser.getSettings().setPluginsEnabled(true);
    wvbrowser.getSettings().setJavaScriptCanOpenWindowsAutomatically(true);
    wvbrowser.addJavascriptInterface(new MyJavaScriptInterface(),"HTMLOUT");
    //wvbrowser.loadUrl("http://www.google.com");
    wvbrowser.loadUrl("javascript:window.HTMLOUT.showHTML('<html>'+document.getElementsByTagName('html')[0].innerHTML+'</html>');");


    txtcode=(TextView)findViewById(R.id.txtcode);
    txtcode.addTextChangedListener(this);

    btcode=(ImageButton)findViewById(R.id.btcode);
    btcode.setOnClickListener(this);

    }

public void onClick(View v)
{
    if(btgo==v)
    {
        String url=txturl.getText().toString();
        if(!txturl.getText().toString().contains("http://"))
        {
            url="http://"+url;
        }
        wvbrowser.loadUrl(url);
        //wvbrowser.loadData("<html><head></head><body><div style='width:100px;height:100px;border:1px red solid;'></div></body></html>","text/html","utf-8");
    }
    else if(btcode==v)
    {
        ViewGroup.LayoutParams params1=wvbrowser.getLayoutParams();
        ViewGroup.LayoutParams params2=txtcode.getLayoutParams();
        if(flagbtcode==1)
        {
            params1.height=200;
            params2.height=220;
            flagbtcode=0;
            //txtcode.setText(wvbrowser.getContentDescription());
        }
        else
        {
            params1.height=420;
            params2.height=0;
            flagbtcode=1;
        }
        wvbrowser.setLayoutParams(params1);
        txtcode.setLayoutParams(params2);

    }
}

public class HelloWebViewClient extends WebViewClient {
    @Override
    public boolean shouldOverrideUrlLoading(WebView view, String url) {

        view.loadUrl(url);
        return true;
    }
    /*@Override
    public void onPageFinished(WebView view, String url)
    {
        // This call inject JavaScript into the page which just finished loading. 
        wvbrowser.loadUrl("javascript:window.HTMLOUT.processHTML('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");
    }*/

}
class MyJavaScriptInterface
{
    @SuppressWarnings("unused")
    public void showHTML(String html)
    {

        txtcode.setText(html);
    }
}

public void afterTextChanged(Editable s) {
    // TODO Auto-generated method stub

}

public void beforeTextChanged(CharSequence s, int start, int count,
        int after) {
    // TODO Auto-generated method stub

}

public void onTextChanged(CharSequence s, int start, int before, int count) {
    wvbrowser.loadData("<html><div"+txtcode.getText().toString()+"></div></html>","text/html","utf-8");

}

}

जवाबों:


107

दरअसल इस सवाल के कई जवाब हैं। यहाँ उनमें से 2 हैं:

  • यह पहली बार लगभग आपकी ही तरह है, मुझे लगता है कि हम इसे उसी ट्यूटोरियल से प्राप्त करते हैं।

public class TestActivity extends Activity {

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.webview);
        final WebView webview = (WebView) findViewById(R.id.browser);
        webview.getSettings().setJavaScriptEnabled(true);
        webview.addJavascriptInterface(new MyJavaScriptInterface(this), "HtmlViewer");

        webview.setWebViewClient(new WebViewClient() {
            @Override
            public void onPageFinished(WebView view, String url) {
                webview.loadUrl("javascript:window.HtmlViewer.showHTML" +
                        "('<html>'+document.getElementsByTagName('html')[0].innerHTML+'</html>');");
            }
        });

        webview.loadUrl("http://android-in-action.com/index.php?post/" +
                "Common-errors-and-bugs-and-how-to-solve-avoid-them");
    }

    class MyJavaScriptInterface {

        private Context ctx;

        MyJavaScriptInterface(Context ctx) {
            this.ctx = ctx;
        }

        public void showHTML(String html) {
            new AlertDialog.Builder(ctx).setTitle("HTML").setMessage(html)
                    .setPositiveButton(android.R.string.ok, null).setCancelable(false).create().show();
        }

    }
}

इस तरह आपके जावास्क्रिप्ट के माध्यम से HTML को पकड़ो। सबसे सुंदर तरीका नहीं है, लेकिन जब आपके पास अपना जावास्क्रिप्ट इंटरफ़ेस होता है, तो आप इसे छेड़ने के लिए अन्य तरीके जोड़ सकते हैं।


आपके द्वारा चुना गया विकल्प भी निर्भर करता है, मुझे लगता है, जिस पर आप पुनः प्राप्त HTML के साथ क्या करना चाहते हैं ...


जब इस लाइन webview.loadUrl("javascript:window.HtmlViewer.showHTML" + "('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");को प्रोग्राम फ़ंक्शंस (जैसे फंक्शन फिनिश) निष्पादित करते हैं, और उस गतिविधि को रोक देते हैं। क्यों? इसे कैसे हल करें?

7
webview.addJavascriptInterface केवल जेली बीन्स और निचले संस्करण पर काम करता है।
xtr

32
जेलीबीन के लिए उपरोक्त कोड में दो महत्वपूर्ण बदलाव और बाद में: 1. "विंडो हटाएं।" Webview.loadUrl लाइन से - जेलबिन को लक्षित करते समय जावास्क्रिप्ट इंटरफ़ेस को अलग तरह से जोड़ा जाता है। 2. "public void showHTML" से पहले @JavcriptcriptInterface लगाएं - यह आवश्यक है क्योंकि यह एक सुरक्षा जोखिम है जो न केवल कुछ विधियों को कॉल करने की अनुमति देता है।
karlbecker_com

1
अभी भी मेरे लिए काम नहीं करता है (5.1.1) .. जब मैं MyJavaScriptInterface (@karlbecker_com संकेत के साथ) जोड़ रहा हूं, जब मैं लोड पेज सिस्टम पर कुछ क्लिक कर रहा हूं, मुझसे ब्राउज़र चुनने के लिए कहता है। जब मैं इसे हटा दूंगा, तो यह मुझसे दोबारा नहीं पूछेगा।
मकलेले

1
यहाँ मैंने दूरस्थ डिबगिंग को सक्षम किया, यह दिखाया Uncaught ReferenceError: HtmlViewer is not defined, कोई बात नहीं के साथ या बिना@JavascriptInterface
MewX

55

किटकैट और इसके बाद के संस्करण में, आप evaluateJavascriptवेबव्यू पर विधि का उपयोग कर सकते हैं

wvbrowser.evaluateJavascript(
        "(function() { return ('<html>'+document.getElementsByTagName('html')[0].innerHTML+'</html>'); })();",
         new ValueCallback<String>() {
            @Override
            public void onReceiveValue(String html) {
                Log.d("HTML", html); 
                // code here
            }
    });

अधिक उदाहरणों के लिए इस उत्तर को देखें


यह अब तक का उपयोग करने के लिए सबसे आसान समाधान है
बिली

9
FYI करें - एपीआई 19 की आवश्यकता है।
जोएल

7
याद रखें कि इसे ऑनपेज विधि में डालें।
सेड्रिक पोर्टमैन

@Joel एपीआई 19 से नीचे इसे कैसे प्राप्त करें?
प्रतिक सलूजा

1
@PratikSaluja को बहुत खेद है अगर मेरी टिप्पणी ने गलत विचार व्यक्त किया। यहाँ ज्यादातर अपवॉट्स वाला उत्तर मेरे अपने उत्तर से बहुत पुराना है और शायद आपके लिए काम करेगा। इससे आगे का कोई मतलब नहीं था। बहुत खुशी है कि आपको बीटीडब्ल्यू कहीं और देखकर जवाब मिला।
आकाश कुरियन जोस


10

Android WebView एक अन्य रेंडर इंजन है जो HTML सामग्री को HTTP सर्वर से डाउनलोड किया गया है, जो क्रोम या फायरफॉक्स की तरह है। मुझे इसका कारण नहीं पता है कि आपको WebView से रेंडर किए गए पृष्ठ (या स्क्रीनशॉट) की आवश्यकता क्यों है। अधिकांश स्थिति के लिए, यह आवश्यक नहीं है। आप हमेशा HTTP सर्वर से कच्चे HTML सामग्री को सीधे प्राप्त कर सकते हैं।

HttpUrlConnection या HttpClient का उपयोग करके कच्ची स्ट्रीम प्राप्त करने के बारे में पहले से ही पोस्ट किए गए उत्तर हैं। वैकल्पिक रूप से, एंड्रॉइड पर HTML सामग्री पार्स / प्रक्रिया से निपटने के दौरान एक बहुत ही आसान पुस्तकालय है: JSoup , यह HTML सामग्री फ़ॉर्म HTTP सर्वर प्राप्त करने के लिए बहुत ही सरल एपीआई प्रदान करता है, और HTML दस्तावेज़ को प्रबंधित करने में हमारी मदद करने के लिए HTML दस्तावेज़ का एक सार प्रतिनिधित्व प्रदान करता है। एक और अधिक ओओ शैली में लेकिन बहुत आसानी से:

// Single line of statement to get HTML document from HTTP server.
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

यह आसान है, उदाहरण के लिए, आप पहले HTML दस्तावेज़ डाउनलोड करना चाहते हैं, फिर रेंडर करने के लिए इसे WebView करने से पहले इसमें कुछ कस्टम सीएसएस या जावास्क्रिप्ट जोड़ें। उनकी आधिकारिक वेब साइट पर बहुत अधिक, यह जांचने के लायक है।


5

एक स्पर्श बिंदु मैंने पाया कि प्रोग्रेस कॉन्फ़िगरेशन में "छिपा हुआ" है। जबकि HTML रीडर ऐप को डीबग करते समय केवल जावास्क्रिप्ट इंटरफ़ेस के माध्यम से ठीक करता है, यह अब जैसे ही ऐप प्रोगार्ड के माध्यम से चलाया गया था, तब तक काम करता है, जब तक कि एचटीएमएल रीडर फ़ंक्शन को प्रोगार्ड कॉन्फ़िगरेशन फ़ाइल में घोषित नहीं किया जाता है, जैसे:

-keepclassmembers class <your.fully.qualified.HTML.reader.classname.here> {
    public *; 
}

Android 2.3.6, 4.1.1 और 4.2.1 पर परीक्षण और पुष्टि की गई।


4

एंड्रॉइड आपको सुरक्षा चिंताओं के लिए ऐसा नहीं करने देगा। एक दुष्ट डेवलपर बहुत आसानी से उपयोगकर्ता द्वारा दर्ज की गई लॉगिन जानकारी चुरा सकता है।

इसके बजाय, आपको प्रदर्शित होने से पहले वेबव्यू में प्रदर्शित पाठ को पकड़ना होगा। यदि आप एक प्रतिक्रिया हैंडलर स्थापित नहीं करना चाहते हैं (अन्य उत्तरों के अनुसार), तो मुझे यह सुधार कुछ गॉगलिंग के साथ मिला:

URL url = new URL("/programming/1381617");
URLConnection con = url.openConnection();
Pattern p = Pattern.compile("text/html;\\s+charset=([^\\s]+)\\s*");
Matcher m = p.matcher(con.getContentType());
/* If Content-Type doesn't match this pre-conception, choose default and 
 * hope for the best. */
String charset = m.matches() ? m.group(1) : "ISO-8859-1";
Reader r = new InputStreamReader(con.getInputStream(), charset);
StringBuilder buf = new StringBuilder();
while (true) {
  int ch = r.read();
  if (ch < 0)
    break;
  buf.append((char) ch);
}
String str = buf.toString();

यह बहुत अधिक कोड है, और आपको इसे कॉपी / पेस्ट करने में सक्षम होना चाहिए, और इसके अंत strमें एक ही एचटीएमएल होगा जो वेबव्यू में तैयार किया गया है। यह उत्तर वेब पेज से HTML को जावा में स्ट्रिंग में सही ढंग से लोड करने के लिए सरलतम तरीके से है और इसे एंड्रॉइड पर भी काम करना चाहिए। मैंने इसका परीक्षण नहीं किया है और इसे स्वयं नहीं लिखा है, लेकिन यह आपकी मदद कर सकता है।

साथ ही, यह जिस URL को खींच रहा है वह हार्डकोड है, इसलिए आपको इसे बदलना होगा।


1

क्यों नहीं html पहले प्राप्त करें फिर इसे वेब दृश्य में पास करें?

private String getHtml(String url){
    HttpGet pageGet = new HttpGet(url);

    ResponseHandler<String> handler = new ResponseHandler<String>() {
        public String handleResponse(HttpResponse response) throws ClientProtocolException, IOException {
            HttpEntity entity = response.getEntity();
            String html; 

            if (entity != null) {
                html = EntityUtils.toString(entity);
                return html;
            } else {
                return null;
            }
        }
    };

    pageHTML = null;
    try {
        while (pageHTML==null){
            pageHTML = client.execute(pageGet, handler);
        }
    } catch (ClientProtocolException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

    return pageHTML;
}

@Override
public void customizeWebView(final ServiceCommunicableActivity activity, final WebView webview, final SearchResult mRom) {
    mRom.setFileSize(getFileSize(mRom.getURLSuffix()));
    webview.getSettings().setJavaScriptEnabled(true);
    WebViewClient anchorWebViewClient = new WebViewClient()
    {

        @Override
        public void onPageStarted(WebView view, String url, Bitmap favicon) {
            super.onPageStarted(view, url, favicon);

            //Do what you want to with the html
            String html = getHTML(url);

            if( html!=null && !url.equals(lastLoadedURL)){
                lastLoadedURL = url;
                webview.loadDataWithBaseURL(url, html, null, "utf-8", url);
            }
}

यह मोटे तौर पर वही करना चाहिए जो आप करना चाहते हैं। यह WebView से HTML कोड प्राप्त करना और उसके उत्तर के लिए https://stackoverflow.com/users/325081/aymon-fournier से चिल्लाना संभव है


HttpClient को एपीआई स्तर 22 में हटा दिया गया था और एपीआई स्तर 23 में हटा दिया गया था। इसलिए आपके कोड में वर्णित कक्षाएं जावा फाइलों में आयात नहीं की जा सकती हैं।
धनंजय M

1

मैं सुझाव दूंगा कि आप HTML को WebView से निकालने की कोशिश कर रहे हैं, आप URL से HTML निकालें। इसके द्वारा, मेरा मतलब है कि आपके लिए HTML ट्रैस करने के लिए JSoup जैसी किसी थर्ड पार्टी लाइब्रेरी का उपयोग करना। निम्न कोड आपके लिए एक विशिष्ट URL से HTML प्राप्त करेगा

public static String getHtml(String url) throws ClientProtocolException, IOException {
        HttpClient httpClient = new DefaultHttpClient();
        HttpContext localContext = new BasicHttpContext();
        HttpGet httpGet = new HttpGet(url);
        HttpResponse response = httpClient.execute(httpGet, localContext);
        String result = "";

        BufferedReader reader = new BufferedReader(
            new InputStreamReader(
                response.getEntity().getContent()
            )
        );

        String line = null;
        while ((line = reader.readLine()) != null){
            result += line + "\n";
        }
        return result;
    }

मान लीजिए कि डेटा प्राप्त करके url प्राप्त किया जाता है। यह विधि विफल हो जाएगी।
जाफर अली

इसके अलावा कुकीज़ के बारे में क्या?
कीथ एडलर

0

इसे लागू करने के लिए सरल बस HTML सामग्री के मूल्य प्राप्त करने के लिए अपने HTML में javasript तरीकों की आवश्यकता है। अपने कोड से ऊपर के रूप में कुछ परिवर्तन की जरूरत है।

  public class htmldecoder extends Activity implements OnClickListener,TextWatcher
    {
    Button btsubmit; // this button in your xml file
    WebView wvbrowser;
    public void onCreate(Bundle savedInstanceState)
    {
                super.onCreate(savedInstanceState);
                    setContentView(R.layout.htmldecoder);



        btsubmit=(Button)findViewById(R.id.btsubmit);
        btsubmit.setOnClickListener(this);

        wvbrowser=(WebView)findViewById(R.id.wvbrowser);
        wvbrowser.setWebViewClient(new HelloWebViewClient());
        wvbrowser.getSettings().setJavaScriptEnabled(true);
        wvbrowser.getSettings().setPluginsEnabled(true);
        wvbrowser.getSettings().setJavaScriptCanOpenWindowsAutomatically(true);
        MyJavaScriptInterface myinterface=new MyJavaScriptInterface();
        wvbrowser.addJavascriptInterface(myinterface,"interface");
        webView.loadUrl("file:///android_asset/simple.html");  //use one html file for //testing put your html file in assets. Make sure that you done JavaScript methods to get //values for html content in html file . 
   }
   public void onClick(View v)
{
    if(btsubmit==v)
    {

        webView.loadUrl("javascript:showalert()");// call javascript method.  
        //wvbr
    }
}

final class MyJavaScriptInterface {



        MyJavaScriptInterface() {

        }

        public void sendValueFromHtml(String value) {
           System.out.println("Here is the value from html::"+value);
        }

    }

}

Html में आपकी जावास्क्रिप्ट

 <script type="text/javascript">
    //<![CDATA[
    var n1;
    function callme(){
    n1=document.getElementById("FacadeAL").value;
    }
    function showalert(){
     window.interface.sendValueFromHtml(n1);// this method calling the method of interface which //you attached to html file in android. // & we called this showalert javasript method on //submmit buttton click of android. 
    }
    //]]>
    </script>

और सुनिश्चित करें कि आप html में नीचे की तरह callme बुला रहे हैं

<input name="FacadeAL" id="FacadeAL" type="text" size="5" onblur="callme()"/>
आशा है कि यह आपकी मदद करेगा।


इसका क्या मतलब है & Make sure you calling callme like below in html। क्या आपको HTML फ़ाइल में स्क्रिप्ट के नीचे इनपुट टैग लगाने का मतलब है? Thank You

कोई दोस्त नहीं आपको html टैग में javasript विधि callme () ऑन टाइप ऑफ इनपुट टाइप टेक्स्ट को कॉल करना होगा।
श्री साजिद शेख

फिर इस इनपुट टैग को कहां जोड़ा जाए। क्या यह बटन दिखाई दे रहा है?

यह कोड काम करता है, जब गतिविधि को लोड करने के लिए वेबव्यू में एक टेक्स्ट बॉक्स होता है और टेक्स्ट बॉक्स पर टाइप किए गए टेक्स्ट शो होते हैं। लेकिन मुझे वेबव्यू में html कोड चाहिए।

क्या आप इस समस्या को सुलझाने में मेरी मदद कर सकते हैं? Thank you very much

0

मेरा सुझाव है कि यदि आप डिबगर पर खर्च करने का समय रखते हैं, तो कुछ चिंतन दृष्टिकोण का प्रयास करें (क्षमा करें, लेकिन मेरे पास नहीं था)।

कक्षा की loadUrl()विधि से शुरू android.webkit.WebView:

http://grepcode.com/file/repository.grepcode.com/java/ext/com.google.android/android/2.2_r1.1/android/webkit/WebView.java#WebView.loadUrl%28java.lang.String % 2Cjava.util.Map% 29

आपको android.webkit.BrowserFrameउस कॉल पर पहुंचना चाहिए जो कि nativeLoadUrl()मूल विधि है:

http://grepcode.com/file/repository.grepcode.com/java/ext/com.google.android/android/2.2_r1.1/android/webkit/BrowserFrame.java#BrowserFrame.nativeLoadUrl%28java.lang.String % 2Cjava.util.Map% 29

मूल विधि का कार्यान्वयन यहां होना चाहिए:

http://gitorious.org/0xdroid/external_webkit/blobs/a538f34148bb04aa6ccfbb89dfd5fd784a4208b1/WebKit/android/jni/WebCoreFrameBridge.cpp

अच्छे नसीब की शुभकामनाय!


-1

सिपाही ने कहा कि HttpClient का उपयोग करने की कोशिश करें:

public String getHtml(String url) {
    HttpClient vClient = new DefaultHttpClient();
    HttpGet vGet = new HttpGet(url);
    String response = "";    

    try {
        ResponseHandler<String> vHandler = new BasicResponseHandler();
        response = vClient.execute(vGet, vHandler);
    } catch (Exception e) {
        e.printStackTrace();
    }
    return response;
}

क्या आप एक साधारण कामकाजी उदाहरण दिखा सकते हैं। मैं आपके कोड को सेफी के उदाहरण में लागू नहीं कर सकता
केजे

इस विधि में दिए गए url का html स्रोत मिलेगा। यानी getHtml ( google.com ); आपको Google मुख्य पृष्ठ का स्रोत मिलेगा
क्रिस्टोफर हंस

इसके ok.is में वेबव्यू सोर्स प्राप्त करने का कोई विकल्प है। THANKS
किरन केजे

यह कुछ मेरे लिए काम नहीं किया। मुझे परीक्षण स्थल से कोई सामग्री नहीं मिली, जो सामग्री "हैलो वर्ल्ड" थी।
मोमो

-2

ऊपर दिए गए तरीके हैं यदि आपके पास एक वेब यूआरएल है, लेकिन यदि आपके पास एक स्थानीय HTML है तो आप इस कोड द्वारा भी html कर सकते हैं

AssetManager mgr = mContext.getAssets();
             try {
InputStream in = null;              
if(condition)//you have a local html saved in assets
                            {
                            in = mgr.open(mFileName,AssetManager.ACCESS_BUFFER);
                           }
                            else if(condition)//you have an url
                            {
                            URL feedURL = new URL(sURL);
                  in = feedURL.openConnection().getInputStream();}

                            // here you will get your html
                 String sHTML = streamToString(in);
                 in.close();

                 //display this html in the browser or web view              


             } catch (IOException e) {
             // TODO Auto-generated catch block
             e.printStackTrace();
             }
        public static String streamToString(InputStream in) throws IOException {
            if(in == null) {
                return "";
            }

            Writer writer = new StringWriter();
            char[] buffer = new char[1024];

            try {
                Reader reader = new BufferedReader(new InputStreamReader(in, "UTF-8"));

                int n;
                while ((n = reader.read(buffer)) != -1) {
                    writer.write(buffer, 0, n);
                }

            } finally {

            }

            return writer.toString();
        }
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.