Google पत्रक में एक अंतर्निहित फ़ंक्शन है जिसे इम्पोर्टएक्सएमएल कहा जाता है जिसका उपयोग वेबपृष्ठों से सार्वजनिक रूप से उपलब्ध संरचित डेटा को परिमार्जन करने के लिए किया जा सकता है। इंपोर्टएक्सएमएल एक्सएमएल, एचटीएमएल, सीएसवी, टीएसवी, और आरएसएस और एटीओएम एक्सएमएल फीड सहित विभिन्न संरचित डेटा प्रकारों में से किसी से भी डेटा आयात करता है।
इस पोस्ट में हम आपको दिखाएंगे कि कैसे अलग-अलग Pinterest खातों से Pinterest अनुयायियों को एक Google शीट में एकत्र करने के लिए ImportXML फ़ंक्शन का उपयोग किया जाए, और फिर Geckoboard के स्प्रेडशीट डेटा स्रोत का उपयोग करके उस जानकारी को विज़ुअलाइज़ करें।
ImportXML फ़ंक्शन का सिंटैक्स
इम्पोर्टएक्सएमएल फ़ंक्शन का सिंटैक्स है:
=IMPORTXML()
URL: प्रोटोकॉल सहित परीक्षण किए जाने वाले पृष्ठ का URL (उदा. http://).
URL का मान या तो उद्धरण चिह्नों में संलग्न होना चाहिए या “”
उचित टेक्स्ट वाले सेल का संदर्भ होना चाहिए।
XPath क्वेरी: XPath एक अभिव्यक्ति भाषा है जिसका उपयोग XML दस्तावेज़ के भागों को निर्दिष्ट करने के लिए किया जाता है। यहां आप URL पर दिए गए डेटा पर चलने के लिए XPath क्वेरी दर्ज करेंगे. Xpath क्वेरी का मान उद्धरण चिह्नों में संलग्न होना चाहिए “”
XPath क्वेरी का प्रत्येक परिणाम स्प्रेडशीट की अपनी पंक्ति में रखा गया है।
सामान्य XPath प्रश्नों में शामिल हैं:
//h1
- सभी h1s को स्क्रैप करता है//title
- सभी शीर्षकों को स्क्रैप करता है//meta[@name='description']/@content
– मेटा विवरण को स्क्रैप करता है//@href
- सभी लिंक्स को स्क्रैप करता है//link[@rel=’canonical’]/@href
- किसी भी कैननिकल को स्क्रैप करता है//*[@itemtype]/@itemtype
- स्कीमा के स्क्रैप प्रकार//*[@hreflang]
– स्क्रैप्स hreflang
युक्ति: Google Chrome में अपनी DevTools विशेषता के भाग के रूप में Xpaths को कॉपी करने की क्षमता शामिल है। इसे एक्सेस करने के लिए, उस तत्व का निरीक्षण करें जिसमें आप रुचि रखते हैं, उस पर राइट-क्लिक करके और निरीक्षण का चयन करें । तत्व पैनल में, आपके द्वारा हाइलाइट किए गए तत्व पर राइट-क्लिक करें और कॉपी करें > XPath कॉपी करें ।