techbtn.gif (2150 byte) smart_lg.gif (1079 byte)

SOMMARIO


Che cos' é S.M.A.R.T. ?
Negli ultimi anni i progressi evidenti nella tecnologia costruttiva dei dischi sono stati evidenti .
Una misura di questo miglioramento dell'affidabilità é indicato dall' MTBF (Mean Time Between Failures - tempo medio prima di un guasto) che va da 300,000 a 800,000 ore o piú . In confronto con altri dispositivi , l' MTBF dei dischi rigidi é da 10 a 30 volte maggiore di quella di un  floppy disk o di un CD-ROM .
Nonostante cio' , i dischi rigidi restano ancora una delle parti piú critiche del computer ed uno dei componenti piú soggetti a guasti . Ed un guasto al disco rigido é sempre un problema grave .
Anche perché , all'aumento dell'MTBF , si é contrapposto un aumento dei dischi presenti nei sistemi , oltre alla capacita e alla velocitá di rotazione spinte verso limiti assai elevati .
Nei sistemi professionali , la tecnologia RAID prevede giá da tempo la gestione della sicurezza , ma ad un costo non adeguato ai piccoli sistemi .

Come funziona S.M.A.R.T. ?
Il disco rigido é un complesso dispositivi meccanico ed elettronico , composto di molte parti soggette a stress meccanico e termico . S.M.A.R.T. é un insieme di routines che , analizzando le funzioni vitali del drive , cercano di identificare e prevedere i possibili guasti dei diversi componenti .
In aggiunta ai problemi che possono derivare dal maneggio del drive , dai difetti di assemblaggio o dei materiali , anche le condizioni ambientali e l'intensità dell'impiego vengono considerate per verificare possibili cause di guasto che determinerebbe la perdita di dati . Ad esempio , i computer portatili o le applicazioni mobili sono soggette a condizioni di impiego spesso gravose come shock e vibrazioni meccaniche , temperature e umidità elevate ; i dischi usati nelle applicazioni industriali , nei e nei server sono soggetti a carichi di lavoro elevati per periodi di tempo prolungati .
Il software di monitoraggio verifica le prestazioni interne dei motori , dei piatti , delle testine e dell'elettronica , le condizioni di impiego ed ambientali per determinare lo stato di affidabilità complessivo del dispositivo . Una analisi dei dati raccolti é comprato con i dati di sicurezza forniti per quello specifico modello di drive e , se in qualche modo i limiti sono superati , viene generato un messaggio di errore .
In particolari configurazioni , l'host puó giocare un ruolo attivo : ricevendo e trattando in modo opportuno i messaggi del diagnostico puó prendere decisioni ed attivare azioni appropriate in modo automatico . Il software dell'host puó , in tal caso , verificate le condizioni dei drive , non solo avvisare l'amministratore del sistema o l'utente del computer , ma anche  attivare procedure di salvataggio ,  rilocare automaticamente i files o quanto alto necessario per scongiurare la perdita dei dati .

Nel PC , allo stato attuale , la gestione S.M.A.R.T. é compito del BIOS , che provvede una indicazione di errore a  video .

Quali sono i benefici di S.M.A.R.T. ?
Lo scopo evidente é quello di incrementare la sicurezza e l'affidabilità di dispositivi critici ed ancor oggi delicati quali sono gli hard disk . Con le sue funzioni di supervisione in tempo reale , S.M.A.R.T. estende l'area della protezione dei dati con una attivitá di previsione dei possibili difetti di funzionamento , rispetto alla verifica software che é saltuaria e non preventiva .
Le possibilitá di S.M.A.R.T. principali sono :

Mi sembra "magica"questa possibilitá di predire i possibili guasti futuri ...
La maggior parte delle tipologie di guasto di un drive possono essere classificate in categorie precise in quanto coinvolgono componenti o situazioni ben definite ; uno studio statistico di queste categorie porta ogni costruttore alla definizione precisa di parametri e limiti di sicurezza e quindi alla possibilitá di predire , a seguito di un monitoraggio continuo , la possibilitá di  un futuro guasto .
In ciò non c'é niente di strano o di magico : giá da molto tempo é prassi industriale corrente l'attivitá della manutenzione preventiva e della supervisione preventiva , tese a prevenire appunto il guasto prima che esso si verifichi ed a provvedere in tempo alle azioni opportune per mantenere l'efficienza dei sistemi . Le valutazioni per l'azione preventiva vengono derivate da studi statistici e dall'esperienza dei costruttori , in base a cui é possibile preparare algoritmi , tabelle o grafici di riferimento .
Sostanzialmente viene stabilita una serie di parametri critici ed un'area in cui possono fluttuare ; tenendo sotto controllo la situazione con opportune misurazioni é si verifica se uno o piú di questi parametri ha una tendenza a scostarsi dai limiti fissati , indicando una situazione anomala che puó richiedere un intervento .
É ovvio che alcune situazioni o cause sono facilmente quantificabili , mentre altre non lo sono . Ad esempio , la misura delle ore di lavoro , della tensione di alimentazione , della temperatura delle varie parti e dell'ambiente , il numero degli interventi degli automatismi di correzione dovuti a problemi di scrittura o lettura su aree del disco , ecc . Attraverso opportuni algoritmi , questi dati possono essere elaborati e comparati con dei dati campione in modo da rilevare la tendenza allo scostamento , un graduale calo di prestazione o sicurezza , che generalmente é sintomo di futuro guasto .
Nell'immagine , sono identificate le parti del disco che sono soggette alla maggior parte dei guasti .

smart1.JPG (11845 byte) In generale le parti in movimento sono quelle piú soggette a guasti (motori , cuscinetti) .
Altri componenti , come la superficie dei dischi o le testine , pussono avere difetti di fabbricazione o problemi dovuti ad inquinamento dell'atmosfera interna del disco .
I circuiti elettronici sono il fattore di guasto meno predeterminabile , in quanto la rottura dei chip avviene solitamente senza preavviso .
In ogni caso , condizioni di lavoro inadeguate (vibrazioni , temperatura elevata , urti) sono cause che riducono drasticamente la vita del disco .

Alcune situazioni non possono rientrare facilmente nella casistica della prevedibilitá : non sono prevedibili guasti improvvisi che non siano stati anticipati da una divergenza dei parametri , come indicato prima ; ad esempio , il guasto totale di un circuito integrato sul disco puó bloccare istantaneamente la funzionalitá della periferica ed avvenire senza preavviso , anche se tecnologie recenti permettono di introdurre valutazioni relative alle possibilitá di guasto nei substrati e nei circuiti dell'elettronica a bordo .
Come esempio , la tabella seguente riporta alcune delle possibili cause di guasto e la relativa capacita di predizione .

Tipo di guasto Sintomo Causa possibile Predizione
Settori difettosi Crescita della lista dei settori guasti Difetti dei piatti/testine , impiego o maneggio scorretti Velocitá di crescita del numero dei settori difettosi rispetto ai limiti definiti
Errori di accesso Crescita della lista relativa Testine , dischi , elettronica , contaminazione Rilevamento dati di errore superiori rispetto ai limiti definiti
Errori software Crescita della lista relativa Motori , attuatori ,elettronica , impiego o maneggio scorretti Numero elevato di tentativi di accesso , elevato intervento della correzione ECC
Guasto ai motori Messaggio di "drive non ready" Motori , cuscinetti , elettronica , impiego o maneggio scorretti Numero elevato di tentativi di accesso , elevato tempo di accesso o di spin
Errori di seek Elevato numero di errori sul servo Servo , elettronica , impiego o maneggio scorretti Errori di Seek , elevato numero di  calibrazioni
Errore di lettura/scrittura Elevato numero di errori software , errori sul servo Testine , posizionatore , elettronica , impiego o maneggio scorretti Frequenti errori di lettura , frequenti errori dei servocomandi
Drive non risponde Impossibilita di accesso al drive Guasto all'elettronica di controllo Nessuna , tipicamente non prevedibile

Cosa serve per avere S.M.A.R.T. ?
Ovviamente serve un disco dotato di questa caratteristica ed una scheda madre dotata di BIOS che supporti la funzione  .

Perché il BIOS é importante ?
Perché l'attivitá di SMART , per la massima efficienza , é monitorata a livello di BIOS . Solitamente é una opzione abilitabile durante il setup , dove é possibile scegliere se attivare o no la funzione .

S.M.A.R.T. riduce le prestazioni ?
La gestione della funzione richiede un minimo tempo che influenza , anche se in modo trascurabile rispetto ai vantaggi , le prestazioni complessive .

... e se non abilito S.M.A.R.T. nel setup del BIOS ?
Semplicemente non avró disponibile questa funzione ed eventuali messaggi del diagnostico non saranno considerati .

... e se abilito S.M.A.R.T. pur non avendo dischi S.M.A.R.T. nel PC ?
Teoricamente non dovrebbe succedere nulla . In pratica , peró , si é rilevato che per alcuni dischi non SMART , l'abilitazione della funzione creava una situazione di blocco del sistema o problemi a rilevare la presenza o a leggere il CDROM IDE .

Solo i dischi IDE hanno S.M.A.R.T. ?
Anche i dischi SCSI hanno un meccanismo simile , ma definito da una diversa specifica ( ANSI-SCSI Informational Exception Control - IEC document X3T10/94-190) previsto per una segnalazione di errore semplificata . Nel caso di Seagate , S.M.A.R.T. é stato unificato sia per IDE che per SCSI . Attenzione alla possibilitá che in un sistema dotato di dischi IDE e SCSI le indicazioni S.M.A.R.T. sia gestite non correttamente .

Ho S.M.A.R.T. attivato e trovo , con un utility tipo Norton , alcuni settori danneggiati . Perché SMART non li segnala ?
Le utilities di test della superficie del disco verificano  la superficie , mentre SMART ha lo scopo di monitorare un complesso di parti del disco , ad es. le testine , la rotazione , la ricalibrazione , il trasferimento dei dati , ecc. Usualmente , nei moderni dischi , un certo numero di settori é conservato per riallocare eventuali difetti di superficie e questo avviene in modo automatico , indipendente da SMART , che ne é comunque informato e si attiva solo quando il numero delle riallocazioni supera un limite prefissato .

É possibile che S.M.A.R.T. fornisca indicazioni errate ?
É possibile verificare che una eventuale indicazione positiva di SMART non sia un errore usando delle utilities opportune , ad es. Data Advisor (© Ontrack Data International, Inc.) . Verificate anche la situazione di eventuali dischi SCSI , onde evitare un conflitto tra i firmware , il BIOS e le indicazioni di errore . É anche possibile che SMART sia attivato da eccessive vibrazioni , riscaldamento o altre variabili ambientali che facciano superare momentaneamente ad alcune parti del disco i limiti predisposti , senza per questo pregiudicare , se si interviene a tempo , lo stato complessivo del drive .


  Altre informazioni su SMART a http://web1.seagate.com/support/disc/faq/smart.shtml


 

Per ogni altra informazione
For any other question

Mappa di navigazione

Copyright © elma srl. Tutti i diritti riservati.
Aggiornato il 17/05/99.