Leggi gli articoli dietro i paywall mascherandoti da Googlebot
- Categoria: Internet
Internet è a un punto di svolta. Il continuo aumento del blocco degli annunci ha posto fine al modello di entrate che si basa esclusivamente sui dollari pubblicitari per gestire siti Web e attività commerciali.
Soprattutto i siti di notizie hanno iniziato a sperimentare modi per diversificare le fonti di reddito e un'opzione importante che siti come The Wall Street Journal, Financial Times, The New York Times, i tempi , o il Washington Post ha implementato o testato è il sistema di paywall.
Esistono diversi tipi di paywall, ma hanno tutti in comune il fatto che bloccano l'accesso ai contenuti; questo può accadere direttamente all'apertura del primo articolo, dopo che un certo numero di articoli è stato letto sul sito, oppure come un sistema di estratti che mostra al lettore il primo paragrafo e sotto le informazioni di iscrizione per leggere il resto.
I paywall potrebbero non richiedere sempre agli utenti di pagare per l'accesso. Alcuni siti potrebbero richiedere agli utenti di registrarsi per utilizzare il sito, ma non caricheranno gli utenti una volta che si sono registrati.
Può avere senso da un punto di vista commerciale e potrebbe essere più redditizio che combattere con utenti che gestiscono adblock, ma c'è un aspetto negativo sia per il sito protetto da paywall che per l'utente bloccato.
I siti perdono un'alta percentuale di visitatori se implementano un sistema di paywall. Non è chiaro quanto sia realmente alta la percentuale, e probabilmente varia da sito a sito, ma è probabile che sia molto più alta della percentuale di visitatori che si iscrivono al sito dopo essere stati presentati con la scelta di iscriversi per leggere l'articolo desiderato.
Per gli utenti, può essere davvero frustrante seguire un collegamento a un articolo dal suono interessante solo per essere bloccato dalla lettura una volta caricata la risorsa; è una perdita di tempo per molti, soprattutto se non viene fornito alcun contenuto prima dell'iscrizione o dell'iscrizione.
Mascherare il tuo browser
Non è un segreto che i siti di notizie consentano l'accesso agli aggregatori di notizie e ai motori di ricerca. Se controlli Google News o la ricerca, ad esempio, troverai articoli di siti con paywall elencati lì.
In passato, i siti di notizie consentivano l'accesso ai visitatori provenienti dai principali aggregatori di notizie come Reddit, Digg o Slashdot, ma questa pratica sembra essere morta al giorno d'oggi. Alcuni potrebbero ancora consentirlo, ma si tratta di tentativi ed errori e la soluzione alternativa potrebbe essere interrotta in qualsiasi momento.
Un altro trucco, incollare il titolo dell'articolo in un motore di ricerca per leggere direttamente la storia memorizzata nella cache, sembra non funzionare più correttamente e gli articoli sui siti con paywall di solito non vengono più memorizzati nella cache.
Suggerimento: controlla il seguente componente aggiuntivo che puoi utilizzare per bypassare i paywall:
User-Agent e Referrer
Probabilmente ti starai chiedendo come i siti bloccano o consentono l'accesso al contenuto del sito. I metodi sono migliorati nel corso degli anni e non è più sufficiente cambiare semplicemente il referrer del browser in https://www.google.com/ per ottenere pieno accesso ai contenuti di un sito.
Invece, i siti utilizzano vari controlli che includono user-agent, referrer e cookie, e talvolta anche di più, per determinare la legittimità dell'accesso.
Informazione Generale
Probabilmente il modo migliore per mascherare il browser è farlo sembrare Googlebot.
- Referente: https://www.google.com/
- User-Agent: Mozilla / 5.0 (compatibile; Googlebot / 2.1; + http: //www.google.com/bot.html
Nota che l'opzione non funziona più su molti siti. Potrebbe essere meglio provare a mascherarsi come proveniente da Twitter o altri siti di social media.
Firefox
Gli utenti di Firefox necessitano di due componenti aggiuntivi del browser per questo: il primo, RefControl, per modificare il valore del referrer quando si visitano siti di notizie, il secondo, Switcher agente utente , per cambiare lo user agent del browser.
Aggiornare : RefControl non è più disponibile. Potresti prova questo alternativa invece. Fine
- Scarica e installa entrambe le estensioni nel browser Web Firefox.
- Toccare il tasto Alt e selezionare Strumenti> Opzioni RefControl.
- Fare clic su 'aggiungi sito', immettere un nome di dominio in sito, selezionare un'azione personalizzata e immettere https://www.google.com/ come referrer.
- Ripeti l'operazione per tutti i siti di notizie a cui desideri accedere (alcuni potrebbero non funzionare anche se apporti le modifiche, quindi tienilo a mente).
- Quando hai finito, chiudi la finestra di configurazione.
- Toccare di nuovo il tasto Alt e selezionare Strumenti> Agente utente predefinito> Modifica agenti utente dal menu.
- Seleziona Nuovo> Agente utente e sostituisci la stringa nel campo Agente utente con Mozilla / 5.0 (compatibile; Googlebot / 2.1; + http: //www.google.com/bot.html). Chiamalo Googlebot.
- Esci dal menu.
- Prima di accedere a questi siti, tocca Alt e seleziona Agente utente predefinito> Googlebot.
Questo è tutto quello che c'è da fare. È un po 'un peccato che non ci siano estensioni per Firefox che cambino automaticamente lo user agent in base ai siti che visiti.
Google Chrome
Gli utenti di Google Chrome possono installare estensioni come Switcher agente utente e Referer Control che sono disponibili per il browser per fare lo stesso.
Esiste tuttavia un'altra possibilità, ovvero creare un'estensione personalizzata che automatizzi il processo nel browser.
Le istruzioni sono fornite su Elaineou . Tutto ciò che serve, fondamentalmente, è creare una nuova directory sul computer locale, creare i due file background.js e manifest.json al suo interno e copiare e incollare il codice trovato sul sito nei file.
Devi abilitare la 'modalità sviluppatore' su chrome: // extensions /, quindi puoi selezionare 'carica estensione decompressa' per scegliere la cartella in cui hai creato i due file per caricare l'estensione in Chrome.
È possibile modificare l'elenco dei siti supportati per aggiungerne di nuovi.