Home > PAC post 2020 > Cosa pensano gli agricoltori della PAC?
agricoltori su campi coltivati
RICA

Cosa pensano gli agricoltori della PAC?

L'indagine RICAsentiment evidenzia vantaggi e criticità della PAC agli occhi delle imprese agricole. 

L'indagine RICAsentiment nasce con l'intento di incrementare la base informativa dell'indagine RICA (Rete di Informazione Contabile Agricola), sfruttando nuove tecniche di analisi utili per conoscere l'opinione degli agricoltori italiani su specifici argomenti. Nella prima ipotesi di applicazione di RICAsentiment l'argomento affrontato è stato quello della PAC. 

La base di partenza di RICAsentiment è quindi l'indagine RICA, basata su un campione casuale stratificato rappresentativo dell'agricoltura italiana e realizzata ogni anno dal CREA-PB, che fa da agenzia di collegamento tra l'Italia e la Commissione Europea. Ciò ha consentito di avere disponibili circa 11.106 aziende, direttamente contattabili e rappresentative dell'agricoltura italiana, a cui poter chiedere opinioni in merito, in questo caso, alla PAC. Inoltre, per ciascuna azienda, sono disponibili anche molte informazioni di carattere strutturale, economico e sociale, che consentono di completare il quadro per l'interpretazione dei risultati.  

La metodologia utilizzata

La sentiment analysis (analisi del sentimento) viene definita come quella applicazione della linguistica computazionale "...che si occupa di classificare ed analizzare le opinioni soggettive e le emozioni espresse in un frammento di linguaggio naturale" (Basile, 2020; p.160) assegnando automaticamente punteggi e/o giudizi positivi, negativi, neutrali ai suddetti frammenti di testo (Liu, 2012; Sharma et al., 2014). 

In questo lavoro la sentiment analysis è stata ottenuta attraverso una risorsa computazionale basata sul dizionario chiamata MAL (Morphologically-inflected Affective Lexicon; Vassallo et al., 2019) applicata con l'utilizzo del software statistico R.

La Text Mining-Clustering (TM-C) (analisi cluster per l'ottimizzazione automatica del testo) consiste in una applicazione della Text Mining (TM) (ottimizzazione automatica dei testi) che applica tecniche informatico-statistiche di riduzione automatica di dati testuali per identificare gruppi omogenei di tematiche all'interno di testi scritti (Gupta & Lehal, 2009; Younis, 2015). 

La TM-C può essere quindi considerata un'analisi cluster per dati testuali ed è stata ottenuta attraverso del softwareIRaMuTeQ version 0.7 alpha 2 (Ratinaud, 2014) che applica l'algoritmo di aggregazione gerarchica discendente (hierarchical descending classification - HDC) conosciuto come analisi automatica delle co-occorrenze (Illia et al., 2014).

L'indagine RICAsentiment ha raccolto 615 questionari su 11.106 inviati, contenenti le seguenti domande:

  1. Quali vantaggi e quali benefici hanno prodotto per la sua azienda gli aiuti della PAC 2014-2020?
  2. E quali sono invece le criticità che ha potuto riscontrare?
  3. Alla luce della nuova riforma PAC post 2020 cosa si aspetterebbe in particolare per la sua azienda dalla nuova programmazione?

La raccolta dei questionari ha previsto un primo invio (15 aprile 2020) e un successivo invio dopo due mesi (15 giugno 2020).

I primi risultati dell'indagine

A livello territoriale (Tabella 1), rispetto al piano di campionamento RICA teorico, sono stati completati per ciascuna regione italiana, in media, il 5,4% dei questionari inviati, con un valore minimo pari al 2,1%, raggiunto in Campania, e un valore massimo pari all'8,7% in Umbria.

Considerando il numero di rispondenti per ciascuna domanda, è emerso che gli agricoltori hanno tutti risposto alla Domanda 1, seguita dalla Domanda 3 (95,1%, pari a 585 su 615) e dalla Domanda 2 (90,7%, pari a 558 su 615).


Considerando, invece, l'orientamento produttivo si è ottenuta una distribuzione tra i vari poli, in media, pari al 10,0% per polo, con valore minimo del 5,2% del polo olivicolo e valore massimo pari al 17,4% per il polo seminativi, seguiti da viticoltura e fruttiferi (13,7 e 11,5 rispettivamente).

L'analisi del sentimento (figura 1) mostra come i giudizi positivi siano tutti maggiori di quelli negativi, per tutte le domande poste. Tuttavia, il risultato evidenzia che la polarità della seconda domanda, in cui si chiedono le criticità riscontrate, risulta meno concentrata, con una polarità positiva appena superiore al 50%. Infatti, mentre nella prima e terza domanda si ottengono polarità positive elevate (rispettivamente pari al 72,2% e 70,4%), la seconda domanda presenta una polarità positiva meno accentuata (pari al 50,1%).

Nella prima fase di analisi dei risultati è stata realizzata anche un'analisi cluster sulle risposte degli agricoltori alla domanda 2, condotta attraverso il metodo ALCESTE, implementato all'interno del software IRaMuTeQ[3] version 0.7 alpha 2. Essa rende possibile visualizzare gruppi omogenei di risposte associandole alle tipologie di rispondenti, in questo caso le aziende agricole (regione, tipologia di OTE, polarità). I risultati sono riportati nella figura 2, da cui emerge che il carattere più grande è indicatore di maggior frequenza da parte di quel media nel trattare la tematica in esame. 

Figura 2 - Rappresentazione dei risultati della cluster analysis
Figura 2 - Rappresentazione dei risultati della cluster analysis
 
Figura 3 - Rappresentazione delle variabili illustrative usate nella cluster analysis
Figura 3 - Rappresentazione delle variabili illustrative usate nella cluster analysis


Dalla figura 3, invece, emergono i 4 temi che rappresentano le criticità. Il tema positivo indica che esistono delle criticità ma alcune aziende agricole riescono ad affrontarle.
Successivamente sono state selezionate le parole più rilevanti sulle quali è stata costruita un'analisi di similarità, con i punteggi nei rami che indicavano la forza del legame, utile all'interpretazione del cluster.

L'analisi ha consentito di individuare quattro cluster:

Il Cluster Verde, composto dal 26,3% dei termini, in cui le parole riscontrare, criticità, ritardo, pagamento e anno rappresentano le più rilevanti. Tra le variabili descrittive del cluster ritenute più significative troviamo segmenti testuali con polarità neutrale, aziende con orientamento produttivo fruttiferi, miste coltivazioni e allevamento situate in Molise e Basilicata. Questo cluster si caratterizza per la presenza di testo che indica prevalentemente una situazione di criticità, in particolare per le piccole aziende, dove si sono riscontrate difficoltà per i controlli avvenuti nel corso dell'ultimo anno e ritenuti esagerati. Inoltre, viene segnalato un ritardo e una frammentazione nei pagamenti, una difficoltà riscontrata nell'utilizzo dei fondi PSR regionali e problemi legati al calcolo delle superfici (legate al premio a superficie), in particolare per l'alpeggio e per i cereali, dove si riscontrano forti scostamenti annui. A questo, si affiancano anche una lentezza legata alla burocrazia che regola queste procedure. Infine, viene segnalata anche la difficoltà legata anche in questo caso ai tempi lunghi per mettere in piedi le istruttorie delle varie misure.


Figura 4 - Analisi delle similarità del cluster Verde
Figura 4 - Analisi delle similarità del cluster Verde


Il Cluster Rosso è, composto dal 22,0% dei termini, le parole più rilevanti presenti sono: bando, vantaggio ed erogazione. Tra le variabili descrittive del cluster ritenute più significative troviamo segmenti testuali con aziende olivicole situate in Toscana e Sicilia. Tra i principali punti critici emersi si segnala sia una mancanza di fondi per tutte le aziende che osservazioni sui criteri per la determinazione delle graduatorie. Inoltre, i ritardi nei pagamenti non consentono di pianificare gli investimenti, con una difficoltà di accesso al credito per mancanza di fideiussioni. Anche in questo cluster, viene segnalato un calo delle risorse, la lentezza nei pagamenti e una burocrazia farraginosa, in particolar modo per le piccole aziende.

Figura 5 - Analisi delle similarità del cluster Rosso
Figura 5 - Analisi delle similarità del cluster Rosso


Il Cluster Azzurro è composto dal 20,6% dei termini e in esso le parole più significative sono gestione, burocrazia, eccessivo, rischio e pai (piani assicurativi individuali). Le variabili descrittive del cluster significative individuano segmenti testuali con prevalenza di polarità negativa segnalati da aziende con bovini da latte e aziende con seminativi situate in Emilia-Romagna e Liguria. Il cluster è caratterizzato prevalentemente dai termini gestione e burocrazia. Il primo, relativo alla gestione, evidenzia difficoltà per le richieste ritenute eccessive da parte dei funzionari che seguono le misure. Inoltre, anche tutte le pratiche burocratiche per la gestione del rischio e dei pai sono ritenute eccessive e cavillose. Nello specifico, i pai sono stati ritenuti non sufficienti per sopperire ai grandi danni subiti dalle aziende per la cimice asiatica. A tal proposito, viene specificato anche il fatto che le domande si basino troppo su requisiti finanziari piuttosto che agricoli. Infine, viene anche accennato ai costi sostenuti dalle aziende per rivolgersi a tecnici specializzati per la presentazione delle domande, auspicando autonomia in futuro per la presentazione delle domande.

Figura 6 - Analisi delle similarità del cluster Azzurro
Figura 6 - Analisi delle similarità del cluster Azzurro


Nel Cluster Viola, composto dal 31,1% dei termini, in cui spiccano le parole titolo, ettaro, coltura e terreno, emerge una problematica abbastanza sentita dagli agricoltori, quale la graduale riduzione nel tempo dell'importo totale per ettaro del pagamento di titoli storici. Questo comporta una rendita differente tra i vecchi titoli e i nuovi creando forte disuguaglianza di redditività anche tra imprenditori che praticano la stessa attività colturale su una stessa estensione di coltivazione. Inoltre, la PAC dovrebbe diventare più dinamica seguendo i terreni. Ad esempio, se un agricoltore prende in locazione un terreno nuovo dovrebbe in automatico avere diritto ai titoli pieni in base alla superficie indicata nella domanda e non dover cercare titoli sul mercato. Le variabili descrittive del cluster individuano segmenti testuali con prevalenza di polarità positiva segnalati da aziende con cerealicoltura e aziende con erbivori collocate in Veneto, Puglia, Trentino e Piemonte.

Figura 7 - Analisi delle similarità del cluster Viola
Figura 7 - Analisi delle similarità del cluster Viola


Sentiment Analysis e Text Mining rappresentano un nuovo approccio per comprendere direttamente le opinioni e quindi le necessità degli agricoltori, analizzando automaticamente i dati testuali degli agricoltori, ovvero ciò che effettivamente essi dicono. Inoltre, tale approccio consente una notevole riduzione del disturbo statistico e può essere realizzato a costo zero.

L'analisi proposta permette di raccogliere le opinioni degli agricoltori su questioni importanti per il settore e consente, una volta identificati i diversi gruppi interessati e le difficoltà incontrate, di indirizzare meglio misure e interventi politici. Ciò ci consentirebbe di attuare meglio un approccio dal basso verso l'alto e più partecipativo e di ottenere risultati migliori.

 

Bibliografia

  • Basile V. (2020). I Computer e il Linguaggio Naturale. Ithaca: Viaggio nella Scienza, 16, 151-165. Retrieved at: http://siba-ese.unisalento.it/index.php/ithaca/article/view/23009
  • Gupta V., Lehal G.S. (2009). A Survey of Text Mining Techniques and Applications. Journal of Emerging Technologies in Web Intelligence, 1(1).
  • Illia L., Sonpar K., Bauer M.W. (2014). Applying Co-occurrence Text Analysis with ALCESTE to Studies of Impression Management. British Journal of Management, Vol. 25, 352-372. 
  • Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, vol. 5, no. 1, pp. 1-167, 2012.
  • Ratinaud, P. (2014). IRAMUTEQ: Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires [Computer software]. Retrieved at http://www.iramuteq.org
  • Sharma, R., Nigam, S., & Jain, R. (2014). Polarity detection at sentence level. International Journal of Computer Applications, 86(11).
  • Younis E.M.G. (2015). Sentiment Analysis and Text Mining for Social Media Microblogs using Open-Source Tools: An Empirical Study. International Journal of Computer Applications, 112(5). 
  • Vassallo, M., Gabrieli, G., Basile, V., & Bosco, C. (2019). The tenuousness of lemmatization in lexicon-based sentiment analysis. In R. Bernardi, R. Navigli, & G. Semeraro (Eds.), CEUR workshop proceedings: vol. 2481, Proceedings of the sixth Italian conference on computational linguistics, Bari, Italy, November 13-15, 2019. CEUR-WS.org, URL: http://ceur-ws.org/Vol-2481/paper74.pdf
 

Concetta Cardillo, Giuliano Gabrieli, Marco Vassallo
CREA

 
 

PianetaPSR numero 135 giugno 2024