Skraping av innhold (aka web skraping, webhøsting, web data mining etc.) er fremgangsmåten for å kopiere data fra et nettsted. "Skraperne" (vindusviskere) innhold er personene eller programvaren som kopierer dataene. Nettskraping er ikke en dårlig ting.
Faktisk er alle nettlesere i utgangspunktet innholdsskrapere. Det er mange legitime formål for å gjøre innholdsskraping, for eksempel nettindeksering for søkemotorer.
Se vår artikkel på Hvordan stoppe Google fra å indeksere WordPress-bloggen din
Den virkelige bekymringen er om skrapere av innhold på nettstedet ditt er skadelig eller ikke. Konkurrenter vil kanskje stjele innholdet ditt og publiser den som tilhørende dem. Hvis du kan fortelle legitime brukere fra skurkene, har du en bedre sjanse til å beskytte deg selv. Denne artikkelen forklarer det grunnleggende om skraping av nettet, samt noen metoder for å bli kvitt det (eller i det minste redusere viktigheten av dem).
Men før, hvis du aldri har installert WordPress Discover Hvordan installere en WordPress blog i 7 trinn et Hvordan finne, installere og aktivere en WordPress tema på bloggen din
Så tilbake til hvorfor vi er her.
Typer innhold skrapere
Det er mange forskjellige måter for innholdsskrapere å laste ned data. Det er viktig å kjenne til de forskjellige metodene og teknologien de bruker. Metodene spenner fra lavteknologi (en person manuelt kopiere og lime inn innhold) til sofistikerte roboter (automatisert programvare som kan simulere menneskelig aktivitet i en nettleser). Her er et sammendrag av hva du måtte gjøre:
- edderkopper: Nettgjennomgang er en stor del av hvordan innholdsskraper fungerer. En edderkopp som Googlebot starter med å plukke opp en enkelt webside, og gå fra lenke til lenke for å laste ned websider.
- skall-skript: Du kan bruke Linux Shell til å lage innholdsskrapere med skript som GNU Wget for å laste ned innhold.
- HTML-skrape: de ligner skallskript. Denne typen skrape er veldig vanlig. Det fungerer ved å få HTML-strukturen til et nettsted for å finne data.
- Skjermbilder En skjermvisker er et program som fanger inn data fra et nettsted ved å etterligne oppførselen til en menneskelig bruker som bruker en datamaskin til å surfe på Internett.
- menneskelig kopi: dette er hvor en person manuelt kopierer innhold fra nettstedet ditt. Hvis du noen gang har skrevet innlegg på nettet, har du kanskje lagt merke til at plagiering er utbredt. Etter at det innledende smiger slites, passer virkeligheten at noen tjener på jobben din.
Det er flere måter å gjøre det samme på. Kategoriene av skrapere som er oppført ovenfor, er ikke en uttømmende liste. I tillegg er det mye overlapping mellom kategoriene.
Les også vår artikkel på Hvordan og hvorfor en kvalitativ revisjon av innholdet
Slik beskytter du bloggen din
1. Rate begrensning og blokkering
Du kan bekjempe mange roboter ved å oppdage problemet først. Det er typisk for en automatisert robot å spam serveren din med et eksepsjonelt høyt antall forespørsler. Rate throttling, som navnet antyder, begrenser serverforespørsler fra en individuell klient ved å sette en regel.
Du kan gjøre ting som å måle millisekundene mellom forespørslene. Hvis interaksjonen med nettstedet ditt er for raskt, vet du at det er en bot. Deretter blokkerer denne IP-adressen. Du kan blokkere IP-adresser basert på en rekke kriterier, inkludert opprinnelsesland.
2. Registrering og tilkobling
Registrering og pålogging er en populær måte å holde innholdet utenfor nysgjerrige øyne. Du kan hindre fremdriften til robotene. Alt du trenger å gjøre er å gjøre tilgang til innholdet ditt betinget av en tilkobling. Det grunnleggende om tilkoblingssikkerhet gjelder her. Husk at sider som krever registrering og pålogging ikke vil bli indeksert av søkemotorer.
3. Honeypots og falske data
I datavitenskap er "honningkasser" virtuelle brodoperasjoner. Du avrunder potensielle angripere ved å sette feller med en honeypot for å oppdage trafikk fra innholdsskrapere. Det er et uendelig antall måter å gjøre dette på.
For eksempel kan du legge til en usynlig lenke på websiden din. Deretter oppretter du en algoritme som blokkerer IP-adressen til klienten som klikket på lenken. Mer sofistikerte honningpotter kan være vanskelig å sette opp og vedlikeholde. Den gode nyheten er at det er mange open source Honeypot-prosjekter der ute. Sjekk ut dette flotte liste over fantastiske honeypots på github.
4. Bruk en CAPTCHA
Captcha betyr " Fullstendig Automated Public Turing test for å fortelle Datamaskiner og Humans Apart i utgangspunktet en test for å se forskjellen mellom mennesker og roboter. Captchaer kan være kjedelige, men de er også nyttige. Du kan bruke en for å blokkere områder du tror en robot kan ønske å målrette mot, for eksempel en e-postknapp på din Kontaktskjema. Det er mange gode Captcha-plugins tilgjengelig på WordPress, inkludert " captcha Fra Jetpack.
Oppdag også noen premium WordPress-plugins
Du kan bruke andre WordPress plugins for å gi et moderne utseende og for å optimalisere håndteringen av bloggen eller nettsiden din.
Vi tilbyr deg her noen premium WordPress-plugins som vil hjelpe deg å gjøre det.
1. Stripe for Arforms
ARForms har en ny utvidelse som godtar betalinger via Stripe-betalingsportalen. Det kalles “ARForms Stripe”. Sistnevnte integrerer skjemainput og betalinger i en enkelt prosess.
Du kan fakturere kunder med et dynamisk beløp umiddelbart etter innlevering av ARForms.
Les også vår artikkel på Hvordan bruke Stripe på WooCommerce og Easy Digital Download
Du trenger bare å lage et skjema med ARForms, konfigurere det med Stripe og alt er gjort! Du kan stille betaling med Stripe på kort tid.
2. AX Sosial strøm
Hvis du vil vis flere sosiale medier-feeds på nettstedet ditt, deretter plugin-modulen WordPress Social Board vil tillate deg å gjøre dette ved å gi deg seks måter å se kontoaktiviteten din på. Du vil også dra nytte av støtte for 17 sosiale nettverk og flere tilpassbare oppsett.
Funksjonene er blant annet: 6 forskjellige feed-visningsmodi, støtte for et stort flertall av sosiale nettverk, fullt responsivt layout, støtte for reklamebannere, Flerspråklig støtte, en temaleder, detaljert dokumentasjon, etc ...
3. Interaktive verdenskart
Interaktive verdenskart hjelper deg med å lage så mange geografiske kart som du vil, kontinenter, land eller regioner ... og dette med interaktive og fargede markører.
Den er kompatibel med de nyeste versjonene av WordPress og passer perfekt til Plugin for Visual Composer.
Oppdag vår 8 WordPress plugins for å tilpasse utseendet på nettstedet ditt
Takket være interaktive verdenskart vil du kunne vise flere typer regioner, for eksempel: et kart over hele verden, et kontinent eller et subkontinent, et land og mye mer.
Andre anbefalte ressurser
Vi inviterer deg også til å konsultere ressursene nedenfor for å komme videre i grepet og kontrollen av nettstedet og bloggen din.
- Hvilken teknologi (plattform) som skal brukes til bloggen din?
- 5 htaccess-tips for å forbedre sikkerheten til en WordPress-blogg
- Hvordan legge til en cron jobb på WordPress
- Er WordPress en pålitelig programvare?
konklusjonen
Det! Det var alt for denne opplæringen, jeg håper den vil hjelpe deg med å sette opp en praktisk gjøremålsliste for å effektivt beskytte WordPress blog. Føl deg fri til å del tipset med vennene dine på dine sosiale nettverk.
Du vil imidlertid også kunne konsultere våre ressources, hvis du trenger flere elementer for å gjennomføre prosjektene dine med oppretting av nettsteder, ved å konsultere vår guide om WordPress blog oppretting.
Men i mellomtiden, fortell oss om din commentaires og forslag i den dedikerte delen.
...