Gorm作为Go语言中很常用的一个ORM库,功能非常强大。应用程序的大量时间都花在通过gorm与数据库连接上面,所以我们想在链路跟踪中获得更好的视图。

幸运的是,Gorm有完美的钩子,我们可以通过Callbacks API将跟踪功能注入到数据库处理当中。Callbacks API允许我们为Gorm提供在查询生命周期的特定部分中执行相应的函数,或者允许您在传统的中间件方法中更改查询行为,或者在我们的例子中,为可观察性提取数据。

func beforeQuery(scope *gorm.DB) {
    // do stuff!
}

db.Callback().
    Create().
    Before("gorm:query").
    Register("instrumentation:before_query", beforeQuery)

这篇文章的目标是在我们的Gorm查询中引入链路跟踪,为了做到这一点,我们需要同时捕获开始和结束事件,并相应地处理链路信息span。在这些例子中,我将使用go.opencensus.io/trace提供的跟踪工具,它对接谷歌云跟踪,但其他跟踪库的行为应该类似。

现在我们有一个函数在查询开始时调用,我们需要引入链路追逐:

func beforeQuery(scope *gorm.DB) {
    db.Statement.Context = startTrace(
    db.Statement.Context,
    db,
    operation,
  )
}

func startTrace(
  ctx context.Context,
  db *gorm.DB,
) context.Context {
    // 判断是否需要启动链路追逐,查看追踪的span是否存在
    if span := trace.FromContext(ctx); span == nil {
        return ctx
    }

    ctx, span := trace.StartSpan(ctx, "gorm.query")
    return ctx
}

然后我们需要对这个追踪span收尾处理:

func afterQuery(scope *gorm.DB) { endTrace(scope) }

func endTrace(db *gorm.DB) {
    span := trace.FromContext(db.Statement.Context)
    if span == nil || !span.IsRecordingEvents() {
        return
    }

    var status trace.Status

    if db.Error != nil {
        err := db.Error
        if err == gorm.ErrRecordNotFound {
            status.Code = trace.StatusCodeNotFound
        } else {
            status.Code = trace.StatusCodeUnknown
        }

        status.Message = err.Error()
    }
    span.SetStatus(status)
    span.End()
}

db.Callback().
    Query().
    After("gorm:query").
    Register("instrumentation:after_query", afterQuery)

现在我们可以在链路追踪中看到所有gorm查询!

然而,上图中不太清楚查询实际上在做什么,让我们看看是否可以让这些span包含更多有用信息,通过添加:

  • 数据库表名信息和查询指纹
  • 函数调用代码行数
  • 查询的WHERE参数
  • 影响表行数

查询指纹是查询的唯一标识符,与格式和变量无关,因此您可以唯一地标识在数据库中具有相同行为的查询。
让我们扩展前面的代码:

func startTrace(ctx context.Context, db *gorm.DB) context.Context {
    // Don't trace queries if they don't have a parent span.
    if span := trace.FromContext(ctx); span == nil {
        return ctx
    }

    // start the span
    ctx, span := trace.StartSpan(ctx, fmt.Sprintf("gorm.query.%s", db.Statement.Table))

    // set the caller of the gorm query, so we know where in the codebase the
    // query originated.
    //
    // walk up the call stack looking for the line of code that called us. but
    // give up if it's more than 20 steps, and skip the first 5 as they're all
    // gorm anyway
    var (
        file string
        line int
    )
    for n := 5; n < 20; n++ {
        _, file, line, _ = runtime.Caller(n)
        if strings.Contains(file, "/gorm.io/") {
            // skip any helper code and go further up the call stack
            continue
        }
        break
    }
    span.AddAttributes(trace.StringAttribute("caller", fmt.Sprintf("%s:%v", file, line)))

    // add the primary table to the span metadata
    span.AddAttributes(trace.StringAttribute("gorm.table", db.Statement.Table))
    return ctx
}

func endTrace(db *gorm.DB) {
    // get the span from the context
    span := trace.FromContext(db.Statement.Context)
    if span == nil || !span.IsRecordingEvents() {
        return
    }

    // set the span status, so we know if the query was successful
    var status trace.Status
    if db.Error != nil {
        err := db.Error
        if err == gorm.ErrRecordNotFound {
            status.Code = trace.StatusCodeNotFound
        } else {
            status.Code = trace.StatusCodeUnknown
        }

        status.Message = err.Error()
    }
    span.SetStatus(status)

    // add the number of affected rows & query string to the span metadata
    span.AddAttributes(
        trace.Int64Attribute("gorm.rows_affected", db.Statement.RowsAffected),
        trace.StringAttribute("gorm.query", db.Statement.SQL.String()),
    )
    // Query fingerprint provided by github.com/pganalyze/pg_query_go
    fingerprint, err := pg_query.Fingerprint(db.Statement.SQL.String())
    if err != nil {
        fingerprint = "unknown"
    }

    // Rename the span with the fingerprint, as the DB handle
    // doesn't have SQL to fingerprint before being executed
    span.SetName(fmt.Sprintf("gorm.query.%s.%s", db.Statement.Table, fingerprint))

    // finally end the span
    span.End()
}

func afterQuery(scope *gorm.DB) {
    // now in afterQuery we can add query vars to the span metadata
    // we do this in afterQuery rather than the trace functions so we
    // can re-use the traces for non-select cases where we wouldn't want
    // to record the vars as they may contain sensitive data

    // first we extract the vars from the query & map them into a
  // human readable format
    fieldStrings := []string{}
    if scope.Statement != nil {
        fieldStrings = lo.Map(scope.Statement.Vars, func(v any i int) string {
            return fmt.Sprintf("($%v = %v)", i+1, v)
        })
    }
    // then add the vars to the span metadata
    span := trace.FromContext(scope.Statement.Context)
    if span != nil && span.IsRecordingEvents() {
        span.AddAttributes(
            trace.StringAttribute("gorm.query.vars", strings.Join(fieldStrings, ", ")),
        )
    }
    endTrace(scope)
}

现在,我们获得了非常简单详细的数据库查询跟踪信息,使我们更容易理解我们的应用程序在做什么!

Gorm为查询生命周期的不同部分提供回调,你可以为它们添加特定的行为,我们目前分别跟踪创建、删除、更新和查询,但如果你想更进一步,你可以查看Gorm文档!. 你可以在这里[https://gist.github.com/arussellsaw/bbedfdefee119b4600ce085b773da4b9]找到这篇文章中的所有代码。
请记住,如果不小心,您可能会追踪到一些敏感数据。因此,请确保清理您的查询变量。一个好的实践是只跟踪SELECT查询,因为它们通常是通过ID完成的,而不是任何敏感信息。

转自:https://www.jianshu.com/p/d9aaada29dab