当前位置 : 主页 > 编程语言 > 其它开发 >

.Net CLR GC动态获取函数头地址,C++的骚操作(慎入)

来源:互联网 收集:自由互联 发布时间:2022-06-18
前言: 太懒了,从没有在这里正儿八经的写过文章。看到一些人的高产,真是惭愧。决定稍微变得不那么懒。如有疏漏,请指正。 .net的GC都谈的很多了,本篇主要是剑走偏锋,聊聊一
前言:

太懒了,从没有在这里正儿八经的写过文章。看到一些人的高产,真是惭愧。决定稍微变得不那么懒。如有疏漏,请指正。
.net的GC都谈的很多了,本篇主要是剑走偏锋,聊聊一些个人认为较为核心的细节方面的问题。至于,标记,计划,压缩,清扫这些不在讨论之列。

动态函数头地址的一些概念:

一段内存有内存的起始地址(暂叫base),内存的结束地址,以及内存指针当前指向的地址大致的三个概念。而在这段内存里面分配了函数之后,一个函数在内存里面必定有一个函数的起始地址也就是指令(第一个push)所在的地址,称之为函数头地址,函数的结束地址也就是指令(ret)所在的地址。在函数里面做了一些事情,那么这些可以称之为函数中间的某个地址。
通过函数中间的某个地址(不固定的)获取到函数头地址(固定的)。称之为动态获取函数头地址
硬编码动态获取到函数头地址之后,你就可以得到GC信息,方法描述符信息,调试信息,异常信息,回滚信息,帧栈信息等等。

C#代码:
    static void Main(string[] args)
        {
            GC.Collect();
            Console.ReadLine();
        }

把这段代码反汇编一下:

7:         static void Main(string[] args)
     8:         {
00007FFB098C5EC0 55                   push        rbp  
00007FFB098C5EC1 57                   push        rdi  
00007FFB098C5EC2 56                   push        rsi  
00007FFB098C5EC3 48 83 EC 30          sub         rsp,30h  
00007FFB098C5EC7 48 8B EC             mov         rbp,rsp  
00007FFB098C5ECA 33 C0                xor         eax,eax  
00007FFB098C5ECC 48 89 45 28          mov         qword ptr [rbp+28h],rax  
00007FFB098C5ED0 48 89 4D 50          mov         qword ptr [rbp+50h],rcx  
00007FFB098C5ED4 83 3D 95 CB 09 00 00 cmp         dword ptr [7FFB09962A70h],0  
00007FFB098C5EDB 74 05                je          ConsoleApp10.Program.Main(System.String[])+022h (07FFB098C5EE2h)  
00007FFB098C5EDD E8 0E 27 CB 5F       call        00007FFB695785F0  
00007FFB098C5EE2 90                   nop  
     9:             GC.Collect();
00007FFB098C5EE3 E8 70 ED FF FF       call        CLRStub[MethodDescPrestub]@7ffb098c4c58 (07FFB098C4C58h)  
00007FFB098C5EE8 90                   nop  
    10:             Console.ReadLine();
00007FFB098C5EE9 E8 42 FF FF FF       call        CLRStub[MethodDescPrestub]@7ffb098c5e30 (07FFB098C5E30h)  
00007FFB098C5EEE 48 89 45 28          mov         qword ptr [rbp+28h],rax  
00007FFB098C5EF2 90                   nop  
    11:         }
00007FFB098C5EF3 90                   nop  
00007FFB098C5EF4 48 8D 65 30          lea         rsp,[rbp+30h]  
00007FFB098C5EF8 5E                   pop         rsi  
00007FFB098C5EF9 5F                   pop         rdi  
00007FFB098C5EFA 5D                   pop         rbp  
00007FFB098C5EFB C3                   ret  

我们看到地址:00007FFB098C5EC0就是函数头的地址。00007FFB098C5EFB则是函数结束地址。中间的比如调用GC.Collection的地址00007FFB098C5EE3和调用Console.ReadLine的地址00007FFB098C5EE9,则可以称之为中间地址。

如何通过中间的某个地址(可能是00007FFB098C5EE3,也可能是00007FFB098C5EE9,还有可能是中间其它地址)动态的找到函数头的固定地址呢?

计算公式一:奇偶数的偏移(value-1)

我们先来看下函数头地址:00007FFB098C5EC0,在内存里面的存储数值。

CLR的操作是:
value-1 =(00007FFB098C5EC0 - base) & 31 >>2+1
base:是函数所在内存的起始地址
value-1:是计算的结果

这个value-1的结果要么是1,要么是5,为啥?仔细分析下。一般的来说,base也就是函数所在的内存的起始地址末尾两字节一般都是 00 00。也就是说 00007FFB098C5EC0 - base 的结果一定是0xnnnnnnnnnnnn5EC0。n表示未知数。因为上面的公式&31,所以只需要关注最后两个字节就可以了。

回到上面为啥value-1等于1或者5呢?不能等于其它。5EC0中C0的二进制是:
1100 0000。把它&31,结果是0。0>>2还是0。然后加上1,结果也就是value-1等于1.

那么5是怎么来的呢?我们注意看,0xC是能被2整除的偶数。如果是不能被2整除的奇数,比如0xD的话,低位的向左第五位必定位1,其它的四位因为函数头的起始地址处在被2整除的地址上,其它四位也就是低4位都是0,右移2之后一定是4,然后 4+1 等于5。

所以低位向左第五位如果是偶数,则value-1为1,如果是奇数则value-1为5。不能有其它,此处大家可以自行验证。

关于计算公式参考:https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/codeman.cpp

计算公式二:0的个数的32位索引

标题头的意思是:以0的个数表示有几个32

还是按照上面来,此处函数头的起始地址是:00007FFB098C5EC0。这里的计算公式略有不同:

value-2 = 28 - (00007FFB098C5EC0 - base) >> 5 & 7 << 2

同样:
base:表示函数所在内存的起始地址
value-2 则是此公式计算的结果

因为此公式右移的是5,而且base最后两位一般为0。所以只需要看最后一字节也就是C0即可。

1100 0000 右移5位,结果为0110,也就是6。6&7等于6,6左移2,结果为0x18。十进制的24。然后28-24 ==4。value-2的结果为4。

公式一计算得出的value-1的值为1。因为C0的C是偶数。所以为1。
公式二计算得出的value-2的值为4。

value = value-1 << value-2
value就是最终函数头地址:00007FFB098C5EC0在内存里面存储的形式,二进制表示就是:0001 0000。十进制的:16 。十六进制的:0x10 。

关于计算公式参考:https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/codeman.cpp

中间地址计算动态找出函数头:

此处中间地址取GC.Collection的地址:00007FFB098C5EE3。

startPos = (00007FFB098C5EE3 - base) >> 5,此处取GC.Collection地址的最后两位5EE3 >> 5。结果为:startPos = 0x2F7。

首先从内存里面取出公式二里面计算的value值:0x10。然后套用公式二的value-2的计算:

Result = 28 -(00007FFB098C5EE3 - base) >> 5 & 7 << 2
很明显Result的结果为 0
把tmp = value >> Result 。
结果tmp == 0x10。

 if (tmp)
    {
        startPos--;
        while (!(tmp & NIBBLE_MASK))
        {
            tmp = tmp >> NIBBLE_SIZE;
            startPos--;
        }
        return base + POSOFF2ADDR(startPos, tmp & NIBBLE_MASK);
    }

NIBBLE_MASK:0xf
POSOFF2ADDR: startPos << 5 + (tmp -1 ) << 2

因为tmp为0x10,所以startPos--。 2f7-1 == 2f6 。然后因为 !(tmp & NIBBLE_MASK) 所以 tmp = tmp >> NIBBLE_SIZE; 也就是 tmp == 1。

那么结果就是 base + 2f6 << 5 + (1 -1) << 2
用n表示未知数 0xnnnnnnnnnnnn5EC0。刚好是函数头的地址。

此方法适用于任何一个中间地址动态获取函数头地址。

过程

我们在C#源代码中调用GC.Collection会运行以下几个步骤:
1.GC.Collection()
2.GCScanRoot()
3.EECodeInfo.Init(寄存器Rip)
4.FindMethodCode(寄存器Rip)
5.通过FindMethodCode找到函数头地址,然后通过函数头的地址-8。得到的就是EHinfo,DebugInfo,GCinfo,MethodDesc,UwndInfo信息
6.通过GCinfo找到根对象
7.通过根对象遍历所有对象
8.在这些对象中找到非存活对象,然后进行回收

这个过程过于复杂,省略了很多与本节主题无关的东西。我们看到FindMethodCode就是获取到函数头的地址的函数。

公式一和二的参考如下:

公式一:

void EEJitManager::NibbleMapSetUnlocked(HeapList * pHp, TADDR pCode, BOOL bSet)
{
    CONTRACTL {
        NOTHROW;
        GC_NOTRIGGER;
    } CONTRACTL_END;

    // Currently all callers to this method ensure EEJitManager::m_CodeHeapCritSec
    // is held.
    _ASSERTE(m_CodeHeapCritSec.OwnedByCurrentThread());

    _ASSERTE(pCode >= pHp->mapBase);

    size_t delta = pCode - pHp->mapBase;

    size_t pos  = ADDR2POS(delta);
    DWORD value = bSet?ADDR2OFFS(delta):0;

    DWORD index = (DWORD) (pos >> LOG2_NIBBLES_PER_DWORD);
    DWORD mask  = ~((DWORD) HIGHEST_NIBBLE_MASK >> ((pos & NIBBLES_PER_DWORD_MASK) << LOG2_NIBBLE_SIZE));

    value = value << POS2SHIFTCOUNT(pos);

    PTR_DWORD pMap = pHp->pHdrMap;

    // assert that we don't overwrite an existing offset
    // (it's a reset or it is empty)
    _ASSERTE(!value || !((*(pMap+index))& ~mask));

    // It is important for this update to be atomic. Synchronization would be required with FindMethodCode otherwise.
    *(pMap+index) = ((*(pMap+index))&mask)|value;
}

公式二:

TADDR EEJitManager::FindMethodCode(RangeSection * pRangeSection, PCODE currentPC)
{
    LIMITED_METHOD_DAC_CONTRACT;

    _ASSERTE(pRangeSection != NULL);

    HeapList *pHp = dac_cast<PTR_HeapList>(pRangeSection->pHeapListOrZapModule);

    if ((currentPC < pHp->startAddress) ||
        (currentPC > pHp->endAddress))
    {
        return NULL;
    }

    TADDR base = pHp->mapBase;
    TADDR delta = currentPC - base;
    PTR_DWORD pMap = pHp->pHdrMap;
    PTR_DWORD pMapStart = pMap;

    DWORD tmp;

    size_t startPos = ADDR2POS(delta);  // align to 32byte buckets
                                        // ( == index into the array of nibbles)
    DWORD  offset   = ADDR2OFFS(delta); // this is the offset inside the bucket + 1

    _ASSERTE(offset == (offset & NIBBLE_MASK));

    pMap += (startPos >> LOG2_NIBBLES_PER_DWORD); // points to the proper DWORD of the map

    // get DWORD and shift down our nibble

    PREFIX_ASSUME(pMap != NULL);
    tmp = VolatileLoadWithoutBarrier<DWORD>(pMap) >> POS2SHIFTCOUNT(startPos);

    if ((tmp & NIBBLE_MASK) && ((tmp & NIBBLE_MASK) <= offset) )
    {
        return base + POSOFF2ADDR(startPos, tmp & NIBBLE_MASK);
    }

    // Is there a header in the remainder of the DWORD ?
    tmp = tmp >> NIBBLE_SIZE;

    if (tmp)
    {
        startPos--;
        while (!(tmp & NIBBLE_MASK))
        {
            tmp = tmp >> NIBBLE_SIZE;
            startPos--;
        }
        return base + POSOFF2ADDR(startPos, tmp & NIBBLE_MASK);
    }
}

你也可以直接参考:
https://github.com/dotnet/runtime/blob/main/src/coreclr/vm/codeman.cpp


微信公众号:jianghupt. QQ群:676817308
上一篇:C++ 炼气期之变量的生命周期和作用域
下一篇:没有了
网友评论