Come rendere possibile la prossima generazione di videocitofoni

I più moderni processori audio/video e le più recenti comunicazioni wireless permettono di passare dagli antiquati campanelli elettrici a sistemi di sicurezza in prima linea e completamente connessi al cloud.

Queste modifiche rappresentano una sfida per gli integratori di sistemi e per i progettisti di prodotti integrati in quanto è necessario introdurre funzioni di elaborazione ad alta intensità, come avvisi di movimento, analisi video, comunicazioni audio bidirezionali, cancellazione del rumore e connettività cloud, in un package compatto e, a volte, alimentato a batteria, che deve anche risultare affidabile e facile da usare. Le tecnologie di automazione e sicurezza domestica si sono trasformate passando da un lusso di nicchia ad una suite di soluzioni praticabili e accessibili per la maggior parte delle famiglie. Al tempo stesso, l’impiego di sistemi di imaging per l’automazione industriale, la sicurezza degli uffici e sistemi di protezione si è sviluppato per includere un maggior numero di funzioni di sorveglianza avanzate e connesse.

Un nuovo attore su questo mercato, che trae vantaggio dal successo delle telecamere di sicurezza connesse sul cloud, è il videocitofono. I proprietari di case e gli affittuari stanno assumendo il controllo della propria sicurezza personale e desiderano monitorare il numero sempre maggiore di pacchi che vengono consegnati davanti alla porta di casa: per questo motivo, i videocitofoni sono diventati popolari e dotati di sempre più funzionalità. Questa tendenza corrisponde alla richiesta da parte del settore industriale di sistemi di sicurezza video/audio e monitoraggio a basso costo e più elaborati.

Le funzionalità dei videocitofoni includono ora l’elaborazione video avanzata con l’uso di machine learning, connettività cloud e comunicazioni wireless, Power over Ethernet (PoE), alimentazione di riserva da batteria, comunicazioni audio avanzate e rilevamento ambientale avanzato, oltre al rilevamento del movimento. L’integrazione di tutte queste funzionalità in un package elettronico resistente alle intemperie e di solo pochi centimetri di spessore pone determinate sfide ai tecnici della progettazione, che si trovano non soltanto a dover includere queste caratteristiche, ma anche a lasciare spazio per l’upgrade delle prestazioni e l’aggiunta di funzionalità per la generazione successiva.

Sviluppi tecnologici per i videocitofoni

I sistemi per citofoni e di sicurezza all’ingresso con funzionalità video e audio centralizzate esistono da decenni. In genere sono stati usati in grandi condomini, uffici e abitazioni di fascia alta e si sono basati sulla televisione a circuito chiuso e sull’osservazione umana. Tuttavia, ora che i citofoni video/audio stanno entrando sul mercato consumer, un semplice campanello, il video monodirezionale e l’audio bidirezionale non sono sufficienti a soddisfare gli appassionati di automazione domestica che conoscono l’Internet of Things.

Allo stesso modo, anche le strutture industriali richiedono metodi più sicuri ed efficaci per monitorare e identificare le potenziali minacce o le violazioni della sicurezza. Questo requisito è alla base dell’inclusione delle funzionalità di elaborazione video nei videocitofoni che possono identificare le persone, generare allarmi a zone e produrre risposte automatiche sulla base di prove visive.

Molti videocitofoni funzionano anche come telecamere di sicurezza attive 24 ore su 24 oppure offrono analoghe funzionalità di acquisizione, archiviazione e analisi.

Sebbene una tecnologia molto semplice di elaborazione video sia in grado di rilevare oggetti non statici, un’elaborazione video più complessa e utile richiede l’uso di avanzati algoritmi di machine learning. Questi sistemi di intelligenza artificiale sono generalmente addestrati sulla base di una gran varietà di casi di test, sebbene alcuni vengano addestrati continuamente con l’utilizzo di informazioni provenienti da telecamere connesse al cloud. Pertanto, sono spesso necessari microcontroller (MCU) o microprocessori più avanzati (MPU) per gestire l’elaborazione edge e determinare quali informazioni comunicare al cloud.

Connettività cloud

Sono due gli argomenti validi per la progettazione di un videocitofono con funzionalità cloud: il loro ridotto fattore di forma, che limita la potenza di elaborazione e l’archiviazione e il successo delle organizzazioni di vigilanza delle comunità che traggono vantaggio dalle app dei citofoni commessi. I consumatori hanno mostrato il loro interesse verso la possibilità di guardare il feed video del loro videocitofono ovunque si trovino e reagire in tempo reale a ciò che vedono.

Per la sicurezza personale e delle comunità (o semplicemente per confermare la ricezione dei pacchi), rendere possibile la connettività cloud permette di realizzare una serie di funzioni utente, mentre i produttori possono fornire aggiornamenti over-the-air e acquisire preziose statistiche e informazioni sull’utilizzo. Tuttavia, l’inclusione della connettività cloud richiede una tecnologia di accesso a Internet, che si tratti di Ethernet via cavo o Wi-Fi. Poiché la maggior parte delle case dotate di cablaggio per citofoni dispone soltanto di qualche tipo di alimentazione in corrente alternata ed è priva di linee Ethernet o altre linee di comunicazione, i videocitofoni Wi-Fi stanno diventando sempre più diffusi.

Comunicazioni wireless

Per applicazioni audio semplici, gli standard wireless comuni come Bluetooth e Zigbee dispongono della larghezza di banda necessaria per supportare citofoni solo audio. Tuttavia, per il trasferimento di dati video il Wi-Fi è lo standard wireless più accessibile e popolare. Nelle case più recenti, dove i costruttori sono consapevoli delle tecnologie di automazione domestica, la connettività Ethernet potrebbe essere disponibile: far passare un cavo per portarlo alla porta di casa è sempre un’opzione realizzabile. Data la quantità di case e appartamenti in affitto, è più probabile che gli affittuari scelgano installazioni non invadenti per mezzo di citofoni con supporto Wi-Fi. Tuttavia, i citofoni Wi-Fi necessitano anche di un sistema dotato di Wi-Fi, con una buona ricezione in corrispondenza di ciascuna porta dove verrà installato un videocitofono.

Power over Ethernet

Nel caso delle case più recenti e di coloro che sono disposti ad effettuare alcune minime opere di ristrutturazione per rendere possibile l’uso della più recente tecnologia per case intelligenti, il PoE può permettere un’installazione a filo singolo per un videocitofono a prestazioni relativamente elevate. Molti dei videocitofoni più recenti superano le capacità di emissione di potenza dei trasformatori tipici (o usurati) dei citofoni e potrebbero necessitare di aggiornamenti, compresa la posa di un nuovo cablaggio in corrente alternata. Con il PoE, un videocitofono potrebbe trarre vantaggio dall’impiego di comunicazioni via cavo affidabili e sicure, nonché dall’alimentazione fino a 100 W, secondo la norma 802.3bt definita nel settembre 2018 dall’IEEE (Institute of Electrical and Electronics Engineers). Lo sfruttamento del PoE consente di erogare alimentazione dinamica senza le preoccupazioni poste dalla limitazione di corrente su soluzioni di alimentazione in CA/CC.

Alimentazione a batteria e batteria di riserva

Poiché molte case e molti appartamenti non dispongono di alcun cablaggio per citofono, l’aggiunta di un cablaggio esterno per l’alimentazione e per la connettività Internet potrebbe risultare impossibile per molti potenziali clienti di videocitofoni. Inoltre, la maggior parte dei proprietari di videocitofoni preferirebbe che eventuali interruzioni di corrente, brownout o sabotaggi deliberati non comportino la disattivazione del più recente ampliamento del loro sistema di sicurezza domestica. Per questo motivo, i videocitofoni a batteria (o quelli che includono almeno una valida batteria di riserva) hanno trovato anch’essi il loro posto sul mercato. Le batterie sono utilizzate sia in sistemi di alimentazione attiva sia su sistemi Wi-Fi completi, dove la ricarica intelligente e la transizione di alimentazione senza soluzione di continuità/l’alimentazione supplementare sono requisiti fondamentali nel fornire l’alimentazione di riserva, pur mantenendo le aspettative di durata della batteria.

Tecnologia audio avanzata

Oltre alle funzionalità video, un’ulteriore tecnologia fondamentale per i videocitofoni è costituita dalle funzionalità audio. Esistono addirittura tecnologie concorrenziali per i citofoni che offrono caratteristiche audio senza video. L’audio bidirezionale, gli eventi ad azionamento audio e il rilevamento della direzione dell’audio sono funzionalità comuni nella maggior parte dei videocitofoni. Sebbene l’audio bidirezionale richieda almeno un altoparlante e un microfono, gli eventi ad azionamento audio e il rilevamento della direzione dell’audio richiedono ulteriori tecnologie di elaborazione dell’audio e, spesso, microfoni aggiuntivi. I trigger degli eventi audio e l’audio bidirezionale sono solitamente implementati attraverso l’uso di algoritmi all’interno di un processore per segnale digitale o un codec. I dati audio codificati vengono spesso comunicati a un’app o all’archiviazione su cloud.

Rilevamento del movimento e monitoraggio ambientale

Una delle funzioni principali di un videocitofono è la capacità di rilevare il movimento. Sebbene molti videocitofoni si affidino semplicemente al tracciamento del movimento attraverso l’elaborazione delle immagini, esistono numerosi altri metodi che possono agevolare il rilevamento del movimento e aiutare ad eliminare i falsi positivi. Queste tecnologie comprendono un metodo relativamente a basso costo e semplice, detto PIR (Passive Infrared Detector). I rivelatori PIR sono diffusi nelle luci a rilevamento del movimento utilizzate per l’illuminazione di sicurezza; tuttavia questo metodo è limitato agli oggetti caldi, come le persone e gli animali più grandi. Per evitare falsi allarmi, i sensori PIR sono normalmente abbinati a sensori aggiuntivi.

Oltre ai sensori visivi e sonori, una gran varietà di ulteriori sensori e funzioni ambientali può aiutare a migliorare le prestazioni dei videocitofoni sulla base delle condizioni esterne. Ad esempio, i sensori di luce ambientale aiutano gli algoritmi di elaborazione delle immagini a regolare adeguatamente l’esposizione video sulla base della luce esterna. Altri sensori comuni includono i sensori di temperatura esterna e interna, i sensori di temperatura della batteria per il monitoraggio degli sbalzi termici di carica e scarica, nonché altri sensori per segnalare manomissioni o furti. I sensori antifurto o antimanomissione includono sensori di vibrazione, sensori d’urto e prossimità o semplici interruttori fissati a parti fondamentali della custodia. I circuiti di gestione dell’alimentazione possono essere dotati, inoltre, di rilevamento della corrente e della tensione per determinare la qualità dell’alimentazione e la necessità di far intervenire la batteria di riserva. Inoltre, una serie di sensori di guasto interno provvede al monitoraggio per verificare il corretto funzionamento dei componenti critici del circuito per la risoluzione dei problemi e la manutenzione.

Principali sfide tecnologiche per i videocitofoni

Come avviene tipicamente nei progetti elettronici, ogni caratteristica supplementare aggiunge generalmente la sua dose di sfide alla progettazione e circuiti aggiuntivi. Sicuramente lo stesso avviene nel caso dei videocitofoni, che solitamente presentano limitazioni in termini di alimentazione, spazio, elaborazione e costi e che pongono ulteriori sfide ai progettisti per realizzare innovazioni con la giusta combinazione di risorse hardware, software e cloud.

L’alimentazione principale dei citofoni è realizzata con trasformatori a 8 V-24 V per 5 VA-30 VA. Con la disponibilità del PoE è possibile soddisfare le esigenze di maggiore potenza dei videocitofoni, in quanto il più recente standard IEEE consente di erogare fino a 71 W di potenz. La possibilità di disporre di uno stadio di alimentazione front end in grado di operare su uno schema di alimentazione a trasformatore tradizionale e su schemi PoE permette di realizzare architetture di alimentazione innovative per funzionare su un’ampia gamma di tensioni d’ingresso e mantenere il collegamento al controller PSE in condizioni di carico leggero.

Le dimensioni, il budget in termini di potenza e le caratteristiche di gestione termica di un videocitofono pongono limiti significativi sulla potenza di elaborazione che è possibile includere. Data la complessità delle funzionalità, compresa l’elaborazione audio e video, la potenza di elaborazione della MCU o della MPU deve essere notevole se richiesta, ma anche consumare il minimo di potenza a dispositivo spento. L’elaborazione a pieno carico potrebbe causare la produzione di notevole calore da parte della MCU, ma il dispositivo deve comunque funzionare a valori estremi e distanti di temperatura. Di conseguenza, i progettisti devono considerare anche la ricerca di un equilibrio fra potenza di elaborazione, carico termico, temperatura ambiente e gestione termica.

Un ulteriore metodo di miglioramento delle funzionalità dei videocitofoni senza aumentare la potenza di elaborazione consiste nello spostare l’elaborazione sui servizi cloud e sfruttare lo streaming dei dati audio e video. Tuttavia, questo metodo richiede un’infrastruttura di comunicazione ad elevata affidabilità in grado di offrire una trasmissione monodirezionale continua.

È ancora relativamente raro che i videocitofoni supportino la connettività Ethernet: pertanto, il Wi-Fi è la soluzione per la connettività in standby. Tuttavia, una connessione wireless affidabile in grado di supportare la larghezza di banda necessaria per lo streaming di video e audio ad alta qualità non è facile da realizzare, in particolare se si considerano i limiti di potenza e le posizioni in cui si trovano i citofoni. L’installazione all’aperto espone i citofoni ad ambienti gravosi e pone questioni pratiche per lo streaming a bit rate elevato.

Il fattore di forma compatto dei citofoni wireless, inoltre, limita lo spazio e il guadagno della struttura dell’antenna. Poiché i consumatori hanno poca scelta su dove posizionare il citofono, e la maggior parte degli installatori di router Wi-Fi, probabilmente, non prende in considerazione l’uscio di casa come posizione fondamentale per il Wi-Fi, il progettista di un videocitofono deve scegliere attentamente un microcontroller con supporto Wi-Fi che disponga di una buona sensibilità in ricezione e basso rumore di fase per funzionare in aree con scarsa ricezione. Sebbene un tipico videocitofono dovrebbe disporre di almeno 1 Mbps di larghezza di banda, un videocitofono di fascia alta o un videocitofono con connessione di scarsa qualità potrebbe richiedere anche fino a 3 Mbps.

L’impiego di una struttura sofisticata del circuito stampato dell’antenna o di antenne all’interno del package può ridurre il degrado delle prestazioni della larghezza di banda causato dai materiali da costruzione e da posizionamenti non ideali. Inoltre, i chip Wi-Fi ad elevata efficienza o le MCU con front end Wi-Fi integrati possono migliorare ulteriormente le prestazioni in ricezione e trasmissione per compensare i limiti di budget energetico.

L’inclusione di una batteria di riserva all’interno di un prodotto risulta più complicata rispetto alla semplice aggiunta di una commutazione a rilevamento di bassa tensione nel sistema della batteria. Inoltre è necessario tenere conto della carica, della scarica e della manutenzione della batteria. Considerando i limiti dovuti al fattore di forma, è probabile che molti produttori di videocitofoni sceglieranno batterie con tecnologia agli ioni di litio (Li-ion) o al nickel-metallo idruro (Ni-MH). Le batterie agli ioni di litio sono fra le batterie a maggiore densità energetica fra le tecnologie attualmente disponibili. Questo tipo di batterie, inoltre, è particolarmente soggetto al degrado prestazionale dovuto al funzionamento ad alte e basse temperature, mentre la tecnologia Ni-MH soffre di problemi di autoscarica eccessiva. Inoltre, la chimica delle batterie agli ioni di litio può surriscaldarsi durante la carica e la scarica in assenza di controller supplementari di carica/scarica che provvedano al rilevamento della temperatura. Poiché la gestione termica delle batterie dipende dalle condizioni ambientali esterne (prevalentemente dalla temperatura e dall’umidità), potrebbe essere opportuno includere funzioni di calibrazione che utilizzino complessi algoritmi o addirittura il machine learning per determinare le migliori condizioni di carica/scarica per una data configurazione delle batterie.

Sebbene gli algoritmi di elaborazione delle immagini possano tracciare e addirittura identificare in modo efficace oggetti fissi e in movimento, i circuiti e gli algoritmi in grado di farlo in tempo reale richiedono generalmente tecnologie ad elevata potenza di elaborazione. Poiché non sempre ci si trova in una situazione ideale, molti produttori di videocitofoni scelgono di utilizzare più tecnologie di rilevamento del movimento in sinergia con sistemi di elaborazione delle immagini. Il rilevamento PIR e, più recentemente, il rilevamento del movimento a onde millimetriche sono tecnologie valide che potrebbero funzionare in combinazione con un rilevatore di movimento per elaborazione video, risparmiando anche una notevole quantità di energia in caso di funzionamento in modalità passiva. Anche metodi di elaborazione delle immagini per il rilevamento del movimento tendono spesso a non dare prestazioni accettabili sulle lunghe distanze, laddove la risoluzione non sia sufficiente a garantire un elevato livello di affidabilità. Sia i rilevatori di movimento a onde millimetriche sia i rilevatori PIR hanno un raggio di diversi metri in modalità passiva. Inoltre, i sensori a onde millimetriche, come quelli utilizzati nei sistemi radar a chip singolo per automobili, sono in grado di fornire un rilevamento preciso e ad alta velocità del movimento e degli oggetti.

I videocitofoni vengono spesso valutati sulla base della loro capacità di captare l’audio in modo chiaro dalle sorgenti interessate. Pertanto è essenziale che un videocitofono possa determinare la direzione di chi parla o di un evento rispetto alla porta. Uno dei motivi per cui si tratta di una caratteristica importante è il fatto che il rumore di fondo e i disturbi esterni si verificano in effetti sulla maggior parte delle porte di città (e anche in campagna). Anche in condizioni ideali, un videocitofono non può tenere conto di tutti gli scenari possibili. Pertanto l’uso delle funzioni di elaborazione dell’audio in base alla direzione di arrivo può ridurre l’audio in sottofondo e permettere di concentrarsi sull’obiettivo desiderato.

Esistono svariati metodi per ottenere tali funzionalità, inclusi i sistemi con microfoni direzionali, beamforming con array di antenne e array di microfoni configurati per la ricezione a campo lontano anziché per la ricezione a campo vicino. Ogni metodo presenta le proprie problematiche, che di solito comportano la necessità di ulteriori microfoni e circuiti aggiuntivi per elaborare l’audio in tempo reale. Non è banale realizzare il circuito giusto che sia in grado di combinare più segnali provenienti da vari microfoni e determinare la corretta dinamica di elaborazione. Ciò è particolarmente vero quando si considerano ambienti urbani rumorosi e diversificati, con notevoli quantità di rumore di fondo trasportato direttamente dall’aria sia ai microfoni sia alla custodia del citofono.

Infine, i problemi legati ai falsi azionamenti del campanello ed alle vulnerabilità della sicurezza rappresentano una sfida significativa per ogni produttore di videocitofoni. Molti valutatori di videocitofoni lamentano il fatto che grandi camion, oggetti ad elevata lucentezza e persino veicoli o pubblicità locali (in genere quelli con volti umani riprodotti su di essi) possono provocare falsi allarmi e azionamenti. Questi falsi positivi sono generalmente visti come una seccatura. La riduzione del numero di falsi azionamenti richiede l’uso di intelligenza artificiale/machine learning più sofisticate per l’elaborazione delle immagini, uno schema di alimentazione efficiente e dinamico e possibilmente modalità operative che tengano conto dell’ambiente in cui è installato il videocitofono. Inoltre, la fusione tra sensori e un gran varietà di algoritmi di rilevamento del movimento e sistemi di elaborazione audio potrebbe fungere da backup per esaminare, identificare e rifiutare i potenziali falsi azionamenti. Con un’app intelligente gli utenti potrebbero persino essere in grado di contribuire agli algoritmi di rilevamento confermando se un segnale acustico è un falso positivo o meno, consentendo ad un videocitofono di calibrarsi più specificamente sul proprio ambiente.

Conclusione

Con l’aumentare della concorrenza e della familiarità dei consumatori nel campo dei videocitofoni aumenta anche la necessità dei produttori di videocitofoni di diversificare le proprie offerte con insiemi di funzionalità avanzate e design innovativi. La sfida principale consiste nel gestire l’antico problema di rendere possibili prestazioni superiori in package più piccoli ed a basso costo che offrano praticità e integrazione perfetta con le configurazioni delle case intelligenti. Molti produttori di videocitofoni stanno puntando su chip MCU ad elevata integrazione con funzionalità Wi-Fi e tecnologie sensoristiche avanzate per migliorare le prestazioni degli algoritmi di intelligenza artificiale/machine learning per l’elaborazione video e audio.

Risorse supplementari

Srinivasan Iyer è System Engineer, Building Automation presso Texas Instruments

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

0