16. Performing Database Recovery
确定执行恢复的必要性
访问不同接口(EM以及命令行)描述和使用可用选项,如RMAN和Data Recovery Advisor执行恢复-控制文件(control file)-重做日志文件(redo log file)-数据文件(data file)打开数据库NoMount: 从ShutDown->NoMount, 读取初始化参数文件(pfile),不检查数据库文件Mount: 从NoMount->Mount,检查参数文件中所列的控制文件是否存在并且同步,任一控制文件丢失,实例均会返回错误并且保持在NoMount状态Open: 从Mount->Open,检查控制文件中所列的重做日志组是否至少存在一组,任何丢失的日志组成员均会被记录到警告日志;检查控制文件中所列的没有offline的数据文件是否存在,如果有文件丢失,会报告包含第一个丢失的文件信息的错误,需要检查v$recover_file获取所有丢失的文件SQL> SELECT name, error 2 FROM v$datafile 3 JOIN v$recover_file 4 USING (file#);保持数据库在打开状态介质错误会导致实例错误:如丢失控制文件,丢失重做日志文件的一个组(即使是inactive的组)或者丢失属于SYSTEM和UNDO表空间的一个数据文件很多时候,实例错误必能全完关闭数据库,在进行恢复之前,需要管理员应用SHUTDOWN ABORT命令Data Recovery Advisor当前仅支持单实例,不支持RAC。rman target / rman> list failure all;V$IR_FAILURE: Listing of all failures, including closed ones (result of the LIST FAILURE command)V$IR_MANUAL_CHECKLIST: Listing of manual advice (result of the ADVISE FAILURE command)V$IR_REPAIR: Listing of repairs (result of the ADVISE FAILURE command)V$IR_FAILURE_SET: Cross-reference of failure and advise identifiers数据库恢复
1.丢失一份控制文件如果控制文件存储在ASM磁盘组,恢复选项如下:1).使用EM根据向导执行恢复2).将数据库置于NoMount模式,然后应用RMAN从现有控制文件中恢复RMAN> restore controlfile from '+DATA/orcl/controlfile/current.260.695209463';如果控制文件存储在普通文件系统1).关闭数据库2).拷贝现有控制文件来替代丢失的控制文件当控制文件成功恢复之后,打开数据库2.丢失某重做日志文件组中的一份重做日志文件
从文件组中删除文件,然后重新添加文件SQL> ALTER DATABASE DROP LOGFILE MEMBER '+DATA/orcl/onlinelog/group_1.261.691672257';SQL> ALTER DATABASE ADD LOGFILE MEMBER '+DATA' TO GROUP 2;清空日志组以重建丢失的文件SQL> ALTER DATABASE CLEAR LOGFILE GROUP #;SQL> ALTER DATABASE CLEAR UNARCHIVED LOGFILE GROUP #;3.在非归档模式下丢失一份数据文件
1).如果数据库没有关闭,则关闭数据库2).从备份中恢复整个数据库,包括所有数据文件和控制文件3).打开数据库4).让用户重新录入自从上次备份以来所做的改变4.在归档模式下丢失一份非关键数据文件
在归档模式下,丢失不属于SYSTEM和UNDO表空间的数据文件,仅影响所在数据文件的对象。1).在EM的维护页面点击执行恢复2).选择数据文件作为恢复类型(Object Type),然后选择"Restore to current time"3).添加所有需要恢复的数据文件4).决定恢复的数据文件位于默认位置或者新的位置(在硬盘或者控制文件丢失的情况下)5).提交RMAN操作以恢复丢失的文件实验:普通表空间,比如users,文件丢失的恢复
模拟损坏:
[oracle@oracle ~]$ sqlplus scott/tigercreate table e as select * from emp;!rm -rf /u01/app/oracle/oradata/orcl/users01.dbf
select * from e;conn /as sysdba
alter system flush buffer_cache;conn scott/tiger
select * from e;conn /as sysdba
alter database datafile 4 offline;!cp -v /u01/app/oracle/backup/hotbk/users01.dbf /u01/app/oracle/oradata/orcl
recover datafile 4;alter database datafile 4 online;
conn scott/tiger
select * from e;发现e表没有丢失,完全恢复
实验:未备份的数据文件丢失的恢复
conn /as sysdba
create tablespace t datafile '/u01/app/oracle/oradata/orcl/t01.dbf' size 1M;conn scott/tiger
create table t tablespace t as select * from dept;!rm -rf /u01/app/oracle/oradata/orcl/t01.dbf
SQL>conn /as sysdba
SQL>alter system flush buffer_cache;SQL>alter database datafile 6 offline;
SQL>alter database create datafile 6;--根据控制文件创建数据文件SQL>select creation_change# from v$datafile where file#=6;--发现恢复的起点是这个文件的创建scn
SQL>recover datafile 6;--直接应用联机redo进行恢复
SQL>select group#, sequence#, status, first_change# from v$log;SQL>select checkpoint_change# from v$datafile_header where file#=6;
SQL>select checkpoint_change#, last_change# from v$datafile where file#=6;SQL>alter database datafile 6 online;--一致,online成功
5.在归档模式下丢失一份关键数据文件
1).如果数据库没有关闭,关闭数据库(SHUTDOWN ABORT)2).Mount数据库3).执行4中的相同步骤以恢复丢失的文件4).打开数据库实验: system表空间的数据文件丢失
模拟破坏:
sqlplus / as sysdba
create table big_t as select * from dba_objects;!rm -rf /u01/app/oracle/oradata/orcl/system01.dbf
alter system flush buffer_cache;恢复:关闭数据库,启动到mount:由于不能正常关闭,只能杀进程:
[oracle@oracle u01]$ ps -ef | grep dbworacle 4410 1 0 08:20 ? 00:00:00 ora_dbw0_orcloracle 4620 4478 0 08:27 pts/2 00:00:00 grep dbw[oracle@oracle u01]$ kill -9 4410startup
select file#,error,change#,time from v$recover_file;查看检查点scn:
ORA10G>select checkpoint_change#, last_change# from v$datafile where file#=1;ORA10G>select checkpoint_change# from v$datafile_header where file#=1;将system表空间的备份拷贝至文件所在的位置:
!cp -v /u01/app/oracle/backup/hotbk/system01.dbf /u01/app/oracle/oradata/orclalter database open; --errorselect checkpoint_change#, last_change# from v$datafile where file#=1;
select checkpoint_change# from v$datafile_header where file#=1;CHECKPOINT_CHANGE#------------------1162060通过备份点找到恢复时应用的第一个归档日志文件:
ORA10G>select name from v$archived_log where 1162060 between FIRST_CHANGE# and NEXT_CHANGE#;
NAME
--------------------------------------------------------------------------------/u01/app/oracle/archivelog/1_59_816604382.dbfrecover datafile 1;
autoalter database open;
select count(*) from big_t;
发现big_t仍然存在,是完全恢复
实验:undo表空间文件丢失的恢复
模拟损坏:
create table e as select * from emp;!rm -rf /u01/app/oracle/oradata/orcl/undotbs01.dbfconn /as sysdba
alter system flush buffer_cache;conn scott/tiger
update e set sal=sal+100;关闭数据库并启动到Mount
conn /as sysdbashutdown abortstartup mount将数据文件拷回相应位置
!cp -v /u01/app/oracle/backup/hotbk/undotbs01.dbf /u01/app/oracle/oradata/orcl/恢复数据文件
recover datafile 2;autoalter database open;
conn scott/tigerselect * from tab;实验:所有数据文件全部丢失
模拟损坏:
SQL>conn scott/tigercreate table e as select * from emp;SQL>exit[oracle@oracle ~]$ cd $ORACLE_BASE/oradata/orcl
[oracle@oracle orcl]$ rm -rf *dbf[oracle@oracle orcl]$ sqlplus / as sysdba
SQL>alter system flush buffer_cache;SQL>conn scott/tigerSQL>exit[oracle@oracle orcl]$ ps -ef | grep dbw
oracle 5056 1 0 08:46 ? 00:00:00 ora_dbw0_orcloracle 15510 14808 0 10:40 pts/1 00:00:00 grep dbw[oracle@oracle orcl]$ kill -9 5056[oracle@oracle orcl]$ sqlplus / as sysdba
SQL>startupSQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl
SQL>recover database;--开始恢复autoSQL>select file#,error,change# from v$recover_file;
SQL>select checkpoint_change#,last_change# from v$datafile;
SQL>select checkpoint_change# from v$datafile_header;SQL>alter database open;--因为一致了,所以打开了
SQL>conn scott/tiger
SQL>select * from e;6. 不完全恢复
实验:基于scn的不完全恢复:
首先模拟损坏:
conn scott/tigerdrop table emp purge;首先通过日志挖掘,找到误删除的时间点
select 'execute dbms_logmnr.add_logfile('''||member||''')' from v$logfileSQL>execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo03.log')
execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo02.log')execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo01.log')启动挖掘:
execute dbms_logmnr.start_logmnr();查询误删除的scn:
select SCN,SQL_REDO from v$logmnr_contents where SEG_OWNER='SCOTT' AND TABLE_NAME='EMP' and sql_redo like '%drop table emp%';SQL>shutdown immediate
SQL>startup mount;SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl--拷贝所有数据文件的备份:
SQL>recover database until change 1236777 --将数据库恢复到误操作的前一时刻autoSQL>alter database open resetlogs;
实验:基于cancel的不完全恢复
[oracle@oracle ~]$ sqlplus / as sysdba
SQL>shutdown abort
SQL>startup mount;SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl
SQL>recover database;--此时进行完全恢复,但是当前日志丢失,所以不能进行完全恢复
autoSQL>recover database until cancel--实施基于cancel的不完全恢复,数据库只能恢复到丢失的日志
cancelSQL>alter database open resetlogs;--要以resetlogs的方式打开数据库,发现日志没了,oracle会以控制文件记录的日志文件重建日志文件
实验:使用备份的控制文件的不完全恢复
主要是针对于误删除表空间的不完全恢复:1)使用现有控制文件进行恢复:
模拟损坏:
SQL>create tablespace tt datafile '/u01/app/oracle/oradata/orcl/tt01.dbf' size 1M;SQL>conn scott/tigerSQL>create table tt tablespace tt as select * from dept;执行全备:
[oracle@oracle u01]$ ./userback.sh[oracle@oracle u01]$ sqlplus / as sysdba
SQL>drop tablespace tt including contents and datafiles;SQL>alter system switch logfile;select 'execute dbms_logmnr.add_logfile('''||member||''')' from v$logfile
SQL>execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo03.log')
execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo02.log')execute dbms_logmnr.add_logfile('/u01/app/oracle/oradata/orcl/redo01.log')SQL>exec dbms_logmnr.start_logmnr();
select SCN,SQL_REDO from v$logmnr_contents where sql_redo like '%drop%'; 485780SQL>shutdown immediate
SQL>startup mountSQL>!cp -v /u01/backup/hotbk/*dbf /u01/app/oracle/oradata/orcl
SQL>recover database until change 485780autoSQL>alter database open resetlogs;
SQL>conn /as sysdba
SQL>select tablespace_name,file_name from dba_data_files;发现tt表空间的文件名已经于之前不一样,因为tt表空间被删除了,控制文件中没有tt表空文件的记录
所以在恢复的过程中oracle自定义了tt表空间文件的名称需要重新对tt表空间的文件进行命名:
SQL>alter tablespace tt rename datafile '/u01/app/oracle/product/11.2/db_1/dbs/MISSING00006' to '/u01/app/oracle/oradata/orcl/tt01.dbf';SQL>alter tablespace tt offline;--此时需要恢复
SQL>recover datafile 6;
autoSQL>alter tablespace tt online;
2)使用备份的控制文件进行恢复:重新对数据库做备份:
./userback.shSQL>drop tablespace tt including contents and datafiles;
SQL>select 'execute dbms_logmnr.add_logfile('''||member||''')' from v$logfileSQL>exec dbms_logmnr.start_logmnr();
SQL>select SCN,SQL_REDO from v$logmnr_contents where sql_redo like '%drop%'; 486128SQL>shutdown immediate
SQL>startup nomountSQL>!cp /u01/app/oracle/backup/hotbk/control.bak /u01/app/oracle/oradata/orcl/control01.ctl
SQL>!cp /u01/app/oracle/backup/hotbk/control.bak /u01/app/oracle/oradata/orcl/control02.ctlSQL>!cp /u01/app/oracle/backup/hotbk/control.bak /u01/app/oracle/oradata/orcl/control03.ctlSQL>alter database mount;
SQL>!cp -v /u01/app/oracle/backup/hotbk/*dbf /u01/app/oracle/oradata/orclSQL>recover database until change 486128 using backup controlfile
autoSQL>recover database until change 486128 using backup controlfile
cancelSQL>alter database open resetlogs;
SQL>select tablespace_name,file_name from dba_data_files;