Πώς να καταπολεμήσετε τον κοροναϊό χρησιμοποιώντας το ξύσιμο του σεληνίου;

Την 11η Μαρτίου 2020, ο Παγκόσμιος Οργανισμός Υγείας (ΠΟΥ) δήλωσε το COVID-19. Επισημαίνει τα περισσότερα από 118.000 κρούσματα της νόσου του κοροναϊού. Αυτή η ασθένεια εξαπλώθηκε σε περισσότερες από 110 χώρες και περιοχές σε όλο τον κόσμο. Και η κατάρτιση σεληνίου αυξάνει την πιθανότητα περαιτέρω παγκόσμιας εξάπλωσης.

Μπορούμε να χρησιμοποιήσουμε την απόξεση ιστού για να συσχετίσουμε τα δεδομένα του COVID -19 και να λάβουμε τα απαραίτητα μέτρα για να σταματήσουμε την εξάπλωσή του.

Web απόξεση:

Πρόκειται για μια μέθοδο πρόσβασης στα δεδομένα από μια ιστοσελίδα προέλευσης και τη χρήση των δεδομένων για χειρισμό και λειτουργία δεδομένων. Οποιοσδήποτε ιστότοπος περιέχει δεδομένα που μπορούν να προβληθούν μέσω ενός προγράμματος περιήγησης. Οι ιστότοποι δεν σας επιτρέπουν να έχετε πρόσβαση στα δεδομένα, ο μόνος τρόπος για να έχετε πρόσβαση στα δεδομένα είναι η μη αυτόματη αντιγραφή και επικόλληση των δεδομένων. Αυτό είναι ένα κουραστικό έργο για να αντιγράψετε και να επικολλήσετε όλα τα δεδομένα. Αντ 'αυτού, μπορούμε να χρησιμοποιήσουμε την τεχνική απόξεσης ιστού για την πρόσβαση στα δεδομένα του ιστότοπου.

Robots.txt:

Δεν μπορείτε να έχετε πρόσβαση μόνο στα δεδομένα κάθε ιστοτόπου που συναντάτε. Ορισμένοι ιστότοποι δεν σας επιτρέπουν να έχετε πρόσβαση στα δεδομένα τους. Δεν μπορείτε να έχετε πρόσβαση στα δεδομένα, αν δεν υποστηρίζονται. Για παράδειγμα, πάρτε www.twitter.com/robots.txt

Τεχνικές απόξεσης ιστού:

Η Python είναι η καλύτερη επιλογή όταν πρόκειται για την απόξεση ιστού και μπορείτε να χρησιμοποιήσετε διαφορετικές βιβλιοθήκες ιστού για απόξεση ιστού, όπως σελήνιο, όμορφο σαπούνι, pandas κ.λπ ...

Ας περάσουμε από το ξύσιμο python σεληνίου.

Διαδικασία απόξεσης ιστού:

  • Θα πρέπει να υποβάλετε ένα αίτημα χρησιμοποιώντας τη λειτουργική μονάδα αιτήσεων μέσω διεύθυνσης URL
  • Το περιεχόμενο HTML θα πρέπει να ανακτηθεί ως κείμενο.
  • Εξετάστε το HTML και τα δεδομένα εξαγωγής. Για την εκτέλεση αυτής της εργασίας κάντε δεξί κλικ με το ποντίκι στο πρόγραμμα περιήγησης και επιλέξτε την επιλογή επιθεώρησης.

Για να εξυπηρετήσουμε το σκοπό μας, ας εκτελέσουμε διαδικτυακή απόξεση χρησιμοποιώντας σελήνιο και python.

Εγκατάσταση σεληνίου:

Το σελήνιο είναι ένα λογισμικό δοκιμών ανοιχτού κώδικα. Κάντε λήψη του σεληνίου και εγκαταστήστε το.

Οδηγούς Web:

Τα προγράμματα οδήγησης Web επιτρέπουν στον Python να παρακολουθεί το πρόγραμμα περιήγησης μέσω αλληλεπιδράσεων σε επίπεδο λειτουργικού συστήματος. Τα προγράμματα οδήγησης Web χρησιμοποιούν την ενσωματωμένη υποστήριξη του προγράμματος περιήγησης για τη διαδικασία αυτοματισμού, ώστε το πρόγραμμα οδήγησης ιστού να είναι ενεργοποιημένο και προσβάσιμο μέσω της μεταβλητής PATH του λειτουργικού συστήματος (απαιτείται μόνο για χειροκίνητη εγκατάσταση) για να λειτουργήσει το πρόγραμμα περιήγησης.

Μπορείτε να κατεβάσετε τα προγράμματα οδήγησης από τα αντίστοιχα προγράμματα περιήγησης σύμφωνα με τη χρήση όπως το Chrome, Firefox, Safari, κλπ ...

Μπορείτε να μάθετε πώς να αναπτύξετε σελήνιο μέσω της online εκπαίδευσης σεληνίου Hyderabad.

Υπάρχει μια καρτέλα "Terminal" στον κώδικα VS που σας επιτρέπει να ανοίξετε ένα εσωτερικό τερματικό μέσα στον κώδικα VS, το οποίο είναι πολύ χρήσιμο για να συγκεντρωθούν τα πάντα σε ένα μέρος.

Υπάρχουν μερικά ακόμα πράγματα που πρέπει να προσθέσετε όταν έχετε αυτή τη διαθεσιμότητα, και αυτό είναι το εικονικό περιβάλλον και το σελήνιο για τους οδηγούς ιστού. Πληκτρολογήστε αυτές τις εντολές στο τερματικό σας.

  • pip3 install virtual lenv
  • Πηγή venv / bin / ενεργοποίηση
  • Το Pip3 εγκαθιστά το σελήνιο

Η εγκατάσταση του εικονικού περιβάλλοντος ολοκληρώθηκε. Καλόμαστε να κάνουμε το επόμενο βήμα.

Εκτέλεση του κώδικα:

Πρέπει να δημιουργήσετε μια κλάση και να προσθέσετε λειτουργίες για αυτήν.

Ονομάστε και δημιουργήστε το εργαλείο και ξεκινήστε το πρόγραμμα οδήγησης.

class Coronavirus ()
def__init __ (αυτο)
self.driver = webdriver.crome

Αφού εκτελέσετε αυτόν τον κώδικα, μεταβείτε στο τερματικό και εκτελέστε τον επόμενο κώδικα.

Python-i coronavirus.py

Αυτή η εντολή μας βοηθά να κάνουμε το αρχείο μας διαδραστικό ως sandbox. Η νέα καρτέλα του προγράμματος περιήγησης θα ανοίξει και μπορούμε να αρχίσουμε να εκδίδουμε εντολές. Μπορείτε να χρησιμοποιήσετε τη γραμμή εντολών αντί να πληκτρολογείτε απευθείας στον πηγαίο κώδικα σας εάν θέλετε να δοκιμάσετε. Μόνο αντί να χρησιμοποιήσετε την αποστολή, χρησιμοποιήστε bot.

Στο τερματικό:
Bot = κορωναϊός ()
Bot.driver.get ('https://www.worldometers.info/coronavirus/')
Κωδικός πηγής:
Self.driver.get ('https://www.worldometers.info/coronavirus/')

Όταν μεταφέρουμε στον ιστότοπο, ο πίνακας αντιγράφεται με αυτόν τον τρόπο.

Xpath:

Το XPath είναι η σύνταξη μιας διαδρομής έκφρασης για τον εντοπισμό ενός αντικειμένου στο DOM. Το XPath έχει τη σύνταξη του για να βρει τον κόμβο από το στοιχείο ρίζας είτε χρησιμοποιώντας μια απόλυτη διαδρομή είτε χρησιμοποιώντας μια σχετική διαδρομή οπουδήποτε στο κείμενο.

πίνακας = self.driver.find_element_by_xpath ('// * [@ id = "main_table_countries"] / tbody [1]')

Τώρα φτάστε στη χώρα στον πίνακα που θέλετε αρχικά τα δεδομένα

country_element = table.find_element_by_xpath ("// td [περιέχει (κείμενο (), 'Ινδία')]

Στη συνέχεια, διαιρέστε τα δεδομένα και δείτε τα σε διαφορετικές μεταβλητές

δεδομένα = row.text.split ("") total_cases = δεδομένα [1] new_cases = δεδομένα [2] total_deaths = δεδομένα [3] new_deaths = data [4] active_cases = data [5] serious_critical = data [6] [7]

Ειδοποίηση ηλεκτρονικού ταχυδρομείου:

Πρέπει να ρυθμίσουμε το διακομιστή αποστολής μηνυμάτων ηλεκτρονικού ταχυδρομείου, να μεταβείτε στην υπηρεσία Λογαριασμού Google, να μεταβείτε στην ενότητα "Κωδικοί πρόσβασης εφαρμογών", να δημιουργήσετε έναν νέο κωδικό πρόσβασης και να τον χρησιμοποιήσετε σε αυτό το μικρό έγγραφο.

Κατασκευάζουμε επίσης το πρωτότυπο για το email που θα λάβουμε.

def send_mail (country_element, total_cases, new_cases, total_deaths, new_deaths, active_cases, total_recovered, serious_critical):

server = smtplib.SMTP ('smtp.gmail.com', 587)

server.ehlo ()

server.starttls ()

server.ehlo ()

server.login ('email', 'κωδικός πρόσβασης')

subject = 'Τα στατιστικά στοιχεία του Coronavirus στη χώρα σας σήμερα!'

body = 'Σήμερα στο' + country_element + '\

\ nΥπάρχουν νέα δεδομένα για το coronavirus: \

\ nΣυνολικές περιπτώσεις: '+ συνολικές_επιλογές +' \\ nΝέες περιπτώσεις: '+ new_cases +' \

\ nΟλοι οι θάνατοι: '+ total_deaths +' \

\ nΝέτοιοι θάνατοι: '+ νέοι_ηαθμοί +' \\ nΑνεργές περιπτώσεις: '+ active_cases +' \

\ nΣυνολική ανάκτηση: '+ total_recovered +' \\ nΣεριές, κρίσιμες περιπτώσεις: '+ σοβαρό_κριτικό +' \

\ nΕλέγξτε τη σύνδεση: https://www.worldometers.info/coronavirus/ '

msg = f "Θέμα: {θέμα} \ n \ n {body}"

server.sendmail ('Coronavirus', 'email', msg)

print ('Έχει σταλεί μήνυμα ηλεκτρονικού ταχυδρομείου!') server.quit ()

Εκτελώντας αυτόν τον κώδικα θα λάβετε ενημερώσεις της επιδημίας κορώνας ως ειδοποίηση ηλεκτρονικού ταχυδρομείου.

Συμπέρασμα:

Ως εκ τούτου, οι τεχνικές απόξεσης ιστού βοηθούν στην ανάλυση των ασθενειών που διαδίδονται σε όλο τον κόσμο. Γι 'αυτό σας προτείνω να χρησιμοποιήσετε αυτό το εργαλείο για να προστατεύσετε τον εαυτό σας από αυτή την τρομερή ασθένεια για περισσότερη σεληνιακή εκπαίδευση online.